算法为王:内容创业者的大败局?

【2018-01-17】

  算法是王:内容企业家的失败?

  在去年的里约奥运会期间,一名高级职员今天写下了457条新闻公报和羽毛球,乒乓球和网球的相关报道。平均每天超过30篇文章的产量让平均记者难以回头。这是一个使用自然语言处理,视觉图形和机器学习技术的机器人写作机器人干预写作开始在美国老牌报纸“华盛顿邮报”。早在2012年底,华盛顿邮报启动实时新闻核实项目名为“真相柜台”,可以在整个报刊上记录新闻,文字,声音等信息,然后进行“防伪”数据库比对,发现有异常情况时会发出警报。国内使用手写稿稿,今天头条不是第一,早在2015年9月,腾讯开发的写作机器人DreamWriter就自动引用了统计局的数据,并加入了高级统计师余秋梅的分析师,国家统计局城市管理局和银河证券的分析师发出了第一篇题为“8月份CPI同比上涨2%,创下12个月新高”的消息,不到两年的时间呃,DreamWriter每天在金融+科技应用方面发表了超过2000篇文章,平均每天有500篇文章在运动,平均每天有2500篇文章。随着腾讯第一个投机写机器人,新华社也在同年11月份展示了自己的写作机器人“笔” - 输入股票代码,3秒钟即可生成财务分析,稿件大小标题随时可用,也与图表和其他信息。如果你认为这样的事情只能被互联网公司所使用,那就完全错了。今年4月,云南省第一个写作机器人“小明”在昆明出版社上市。写了一个月左右的时间累积了1000多篇文章。早在1月17日,南方都市报的写作机器人“小南”已经正式发表,并继续撰写春节报道......亿邦电力网整理部分使用写作机器人的新闻权威新闻机构和媒体,如图所示:写作机器人如何撰写新闻稿?昆明报业以“小明”为例。小明集成了人工智能,大数据分析,自然语言处理等最先进的技术,整合网络信息,整合领域知识,深入分析数据,查找重要新闻事件,并以自然语言表达。简单的说就是通过嵌入到系统中的算法获取数据,使用人工模板生成内容。数据采集​​与处理,文章生成,文章发布,这是当前“小明”的基本工作流程。哪些文章包括人造模块规划和文章实现,要解决什么稿子写,怎么写,以及如何提出这样的问题。目前的写作机器人可以过滤和融合现有的文字资料,以第二速度生成报告。一个活的蔬菜服务信息,从数据自动抓取到报告发布,只有一秒的时间。以腾讯DreamWriter为例,DreamWriter项目副主任刘康在接受采访时表示,其实竞争对手也是很聪明的写作机器人,而对方的做法是捕捉直播的描述并通过一定的算法和逻辑连接成一篇文章。不过,Robot DreamWriter是基于特别精细的数据来恢复的。 (注:纽约时报研究与发展实验室已经提出了“粒子”理论,这个理论的核心是:对新闻进行编码,正式解读“积木”编辑模式改变新闻制作,发行的所有链接,并且要最大限度地释放媒体的生产力,具体的做法是对文章进行编码,可以重复使用的部分进行识别和评论,这个过程称为粒子(particles)即所有的信息内容都是转换成可以组装的“粒子”,每一个都可以被重新编码,标记和嵌入。)对DreamWriter而言,球类射击包括射击,居中,高于列......等等可以分解为粒子,粒子和算法模型进行还原,写作机器人背后主要涉及智能创作技术,内容提取技术,新闻提取技术这三大核心技术。很多专利。以“内容提取技术”为例,“梦想作家”可以将数千个词汇汇总为数百个词汇,涉及统计,深度学习等技术。然而,无论是梦幻作家,张晓明还是纽约时报的“花开”,都是体育,科技和金融领域的第一个突破。这类物品具有较高的数据精度和速度要求,但在作业中是重复性的机械作业,机器人可以取代人类工作来完成这部分工作。至于深度草案,行业草案等专业分析性较强的稿件仍然没有优势。以报告的形式,事件报告往往是更多的图形和文字。图像会自动匹配,并可能针对不同的终端和产品类型进行调整。第一财经有限公司唐开智博士在接受采访时表示,他认为机器书写的研究主要集中在三个典型模式:“逻辑从浅到精”。第一类是基于数字的事实表示,是简单的逻辑分析文章,如二级市场监测,体育赛事通讯;二是根据各类稿件的信息点,信息来源进行有针对性的信息提取,将非结构化文本转化为结构化和半结构化的数据,然后根据信息点组合的不同规则写成单点内容;第三类是单点内容的联想,这样的手稿可以弥补单点内容的单一缺陷,并且为受众尤其是投资者,及时解读与专家相关的基础数据和意见,从而产生更深入,更扎实,更全面的手稿。 “语言的生成是一个非常基本的问题,如果我们能很好的解决这个问题,自然语言的理解可能会有更多的突破,如果我们自动模型化,许多方法可以使难题更容易实现。这一步,最后的结果会更好,“今天头条新闻实验室主任李磊表示,可以想象,编写机器人所衍生的一系列”文本范式“算法将成为后续研究的源泉之一,信息流向今天。数据,算法和变革在2015年新华网主办的第一届智能+媒体超级大脑论坛上,中国科学院计算研究所博士生导师白硕发表了“人工智能与媒体”写作机器人,亿邦电力网本节摘录:大家都在谈论人工智能,我们简要回顾一下人工智能的冷热史。三高潮,其实有两波低潮。感知器,专家系统,有两个导致衰退,一个是逻辑的局限性,异或,一个不好的定义的问题。文字识别,语言理解与此有关。在大数据的背景下,也给了一些新的生活。这波人造智能热有什么表现,产业热度:“大脑”,机器人;投资热点:人工智能股票;学术发烧:真脑,模仿脑,电脑;八卦热点:奇异恐慌为什么是这样?快速,准确,大,上帝。什么是快速的,硬件的进步,前景是算法的进步,大数据的积累,上帝,是好奇心,阴谋论。这是一张热点地图,按照两个纬度的三大浪潮主要成就,主要成就进入了飞机。人工智能在什么地方高潮起伏?一个很有意思的现象,第一波是玩具系统,说法比较清楚,解决的比较稳定。对于第二次浪潮来说,解决困难还是比较明确的说法,这在第二次浪潮基本上就克服了,然后上前去邂逅常识取得,非常困难。第三波对角走,声明比较模糊,更难解决,包括图像识别和自然语言理解。第四波是极右派,包括推理,策划,习得常识,情感和自我意识。第三波的自然光源认识还比较浅,第四波深。参与写作,还涉及情绪等。对问题解决思路的定义不明确,模糊的表达方式,一个人自己的标准是可以解决的,机器应该学习别人,跨越三个空间点,一些空间就是问题,中间是特征空间,右边是解决方案的空间,纵向三个阶段,上面是要知道怎么样的问题,什么样的表示方法是建模的,第二个是根据数据来对应的参考,第三个是运行,可能有不明确问题的风险:建模可能被扭曲,抽样可能导致分布偏差,标准可能是错误的,学习可能是过度拟合的,未来的发展方向是从参考到建模,这是知识表示水平,我们不能学习神话深入,我们看到,深度学习全在中间,实际上是框架空间,元组空间,有很多事情可以做,写作机器人,我觉得比较难的问题,一个归因,二是证明,第三 是晶晶,最后是个性风格。归因是对这些现象的描述,这些现象也有一些背景,究竟究竟是什么导致了这种现象,这是归结于描述当日帆船结束之后的趋势,是什么导致了这种趋势的归属。第二个是证据,一个要拿出几个例子,还有英晶,一个画龙点睛的过程,画龙点睛,成语是什么,古诗是非常贴切的描写,这就是书写难的地方。是个性风格,写作是艺术与科学相结合的产物,应该是机器中最难的事情,但是它仍然是自动化的,程序的算法也在迅速增长,实际上由于基于知识的工作可以用软件来自动化,这些工作比一些手工工作更容易,绝大多数大数据是计算机行业中所谓的“非结构化”数据。捕获的数据以各种格式存在,通常难以匹配或比较。传统系统中的信息对齐整齐,搜索和检索快速,可靠,准确。大数据的非结构化特性导致专门设计来解释来自多个来源的大数据的新工具的开发。能够不断处理我们环境资源中的大量信息是人类特别擅长的事情之一,但人们无法在大数据世界中扩展数据。计算机似乎开始依靠人类的独特能力。据华中师范大学新闻与传播学院院长姜素素介绍,新华社等国家级媒体也开始使用人工智能撰稿。它不但解放了新闻生产力,而且直接和更深层的媒体产业和科技融合的生动案例,“媒体+互联网”有了新的应用,也将导致传统新闻观念的创新,生产方式的转变,重组过程和一系列化学反应。人民日报传媒科技公司总经理叶蓁蓁没有观点:低层工作将被取代,质量更高,更好地了解用户的新闻产品将会出现,媒体撬动大数据,利用人工智能,转身,转身,转型的步伐会更快。北京师范大学新闻与传播学院执行主任于国明认为,对于新闻媒体来说,人工智能和人类各有所长,利用机器人进行重复性的任务和精确计算,可以解放记者和编辑,完成更多新闻工作的温度。于国明说:“机器是什么东西?它是在一个游戏规则的框架内,大量的可以通过标准化的规则,程序和机器学习来改进的,现在的规则可以在内部得到改进那些地区的增长速度会非常快,但是对于人类微妙的感情,我相信这台机器还有很长一段时间是不可能完成的。“史密斯,一位资深的商业记者和智能机器人,写了一篇”手稿大赛“双方同时在公司财报后写短文。最后的机器人比人类提前2分钟,时间为7分钟。但是,这个机器人文章只获得了912票的读者票数,9916票给了人类。您未来可能无意中导航的新闻和信息可能是不知疲倦地写成的机器人。机器人行业的发展悄然而至,但真的发生在你我身上。当人工智能以虚拟的手段侵入人的生命时,我们也应该更加理性客观地考察技术革命的时机。在效率的时代,写作机器人可能会把编辑部门变成人工智能储备。只有少数人可以在灌溉和施肥方面做大量的工作,其余的人工智能将不分青红皂白地增长。