范军 陈川 | AI出版:新一代人工智能在出版行业的融合创新
最近几年,人工智能(Artificial Intelligence,AI)可谓世人瞩目的科技新宠。从无人机到无人驾驶,从语音识别到人脸识别,从智能家居到智能机器人,人工智能已进入社会生活的诸多领域。为了在新一轮的技术和产业升级中抢占先机,美、日、俄、欧、印等世界主要经济体先后制定了人工智能发展规划。中国也勇立潮头,奋力推进。随着国务院《新一代人工智能发展规划》和工业和信息化部《促进新一代人工智能产业发展三年行动计划(2018—2020年)》的出台,我国已在战略和行动层面部署人工智能的发展目标。2018年10月,中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。习近平总书记在会上指出:“要发挥人工智能在产业升级、产品开发、服务创新等方面的技术优势,促进人工智能同一、二、三产业深度融合,以人工智能技术推动各产业变革。”出版作为文化产业的重要组成部分,担负着为人民过上美好生活提供丰富精神食粮的神圣职责。在人工智能发展如火如荼的背景下,出版人也应紧抓机遇,以“出版+人工智能”的理念探索AI出版的新形式,为传统出版的创新发展开辟新路径。
一、AI出版的内涵及特点AI出版与人工智能的发展密不可分。所谓人工智能是“利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统”[1],涉及计算机科学、数学、生物学、语言学、心理学、哲学等众多学科。其概念首先由美国学者约翰·麦卡锡(J. McCarthy)于1956年提出。从诞生至今的六十多年间,人工智能先后掀起过多次发展热潮,以目前的第三代人工智能影响最为广泛。第三代人工智能的关键技术主要有机器学习、知识图谱、自然语言处理、人机交互、计算机视觉、生物特征识别、VR(虚拟现实)、AR(增强现实)几种,且已在医疗、教育、司法、交通、零售、物流等多个领域得到了应用。AI出版就是人工智能应用于出版领域的成果。它是一种以人工智能技术为基础的融合并超越传统出版形式的出版活动。从性质上看,AI出版属于数字出版的范畴,但在人力成本、出版效率、阅读体验、成果变现等方面的优势更为突出,可被视为数字出版的2.0形态。从运作方式上看,AI出版以大数据思维引领出版全流程,创造了新的生产加工方式、运营服务方式和产品呈现方式。从产业变革上看,AI出版为传统出版转型提供了新机遇,其发展将可能在未来深刻改变甚至颠覆既有的出版格局。
通过比较AI出版和传统出版的不同,可明确AI出版的四个主要特点:第一,AI出版以机器协作出版生产。传统出版仍处于“人主导+机器执行”的阶段,人通过键盘或触屏发送信号和指令,计算机、印刷机等机器设备负责接收和完成。而AI出版进一步解放出版生产力,使人机联动成为可能。机器能根据大数据分析结果参与出版管理和生产,创造了“人主导+机器辅助”或“机器主导+人辅助”的新模式。第二,AI出版集约利用出版资源。传统出版握有品牌、内容、作者、读者等重要信息却常常陷入无书可出、无书好卖的尴尬境地。AI出版则可依托出版资源数据库制定最优出版方案,提高出版企业的市场敏锐度和反应度。第三,AI出版的产品形态趋于多元。传统出版物多为书刊、报纸等纸质印刷品,AI出版物可以是实体图书,也可以是电子读物,甚至可能是互动机器人,尤其以集文字、图像、语音、VR/AR于一体的融合型出版物最受关注。第四,AI出版注重内容服务和双向互动。传统出版将自身定位为文化产业,其主要任务在于知识生产和传播。AI出版则在兼顾两者的同时重视服务功能,通过出版资源数据库或出版平台,以免费或知识付费的方式与用户互动、互享、互惠,使出版由文化产业转向知识产业甚至智识产业。综合以上分析可知,AI出版以人机生产协作化、业务资源集约化、产品形态多元化、内容服务交互化为主要特点,这些特点也共同指向了人工智能“认知+学习+决策”的工作原理。
二、AI出版模式的四个维度作为一种新兴出版形式,AI出版虽处于起步阶段,但已呈蓬勃发展之势。《2017—2018中国数字出版产业年度报告》显示:“人工智能在新闻出版领域的应用已初具雏形;在智能语音、智能创作、沉浸体验等方面逐渐广泛应用于内容生产和内容推送,实现智能装作、智能呈现与精准智能推送。”[2]具体来看,学术出版、翻译出版、有声读物出版、教育出版是较早与人工智能展开融合的出版形式。随着人工智能技术被越来越多地应用于出版领域,一种新型的AI出版模式正在形成。它以数据分析辅助选题策划,以机器创作创新内容生产,以自动编校提速编辑加工,以市场导向定位印刷发行,塑造了全新的出版业态。
(一)数据分析辅助选题策划
AI出版智能抓取社会热点、行业信息和消费者信息,为出版企业提供关于选题策划的分析报告。众所周知,选题策划处于出版产业链的顶端,对于把握出版全局、保证出版物品质、塑造出版品牌意义重大。一个完整的选题策划过程相对复杂,牵涉众多变量。策划编辑事先要经过构思和市场调研确定基本选题,然后由编辑团队层层讨论修改,再提交选题论证委员会审核通过,接下来报送上级主管部门批准,最后才能进入真正的操作环节。其间既受政策、市场、作者、读者等外部环境影响,也受制于编辑的个人经验、知识储备、职业素养等内部因素。与此同时,出版作为兼具商品和精神属性的产业,对出版物的经济效益和社会效益提出了双重要求。如何在两者间取得平衡也是选题策划时必须考虑的问题。
AI出版在一定程度上降低了人为因素导致的不必要损失,使选题策划拥有全局化思维和科学化手段。面对起伏不定的市场需求和日趋激烈的行业竞争,AI出版以数据信息搭建知识图谱,形成销售预测模型,模拟在不同作者、书名、内容、时间、定价、印量条件下的收益情况,进而确定最终选题。此举可有效规避市场同质化竞争,降低智力成本和出版风险。例如德国新兴出版公司Inkitt将人工智能引入选题策划中,基于算法模型分析读者的阅读模式,可预测不同图书的市场反响情况[3]。我国的方正电子公司也提供以出版大数据辅助选题策划的服务。通过对电商平台、阅读平台、评论平台、微博、微信等元数据去重去噪,再经数据管理、可用性评价、机器学习、情感分析等数据处理和模型计算过程,出版企业就能获得选题策划的依据[4]。
人工智能还能帮科研工作者确定研究课题,推动学术出版智能化。2013年,全球领先的学术出版商爱思唯尔(Elsevier)选择与伦敦大学学院(UCL)共同建立“UCL大数据研究所”,帮助研究者和科研机构从海量数据中计算、评估研究热点,选定研究方向,并为研究成果的转化利用提供决策参考[5]。如果人工智能技术继续取得突破,可以预见,未来出版业的选题策划将可能由机器主导完成。
(二)机器创作创新内容生产
AI出版开启了机器创作(Machine Generated Content,MGC)的新时代,实现了出版内容的自动化生产。近年来,深度学习技术在语音识别、自然语言处理、图像识别、视频处理等方面不断取得突破,并获得了广泛应用。诸如苹果Siri、微软Cortana、亚马逊Alexa等语音助手,谷歌、百度、360等搜索引擎,金山词霸、有道词典等翻译工具所使用的基础技术均与深度学习相关。“深度学习通过建立深层神经网络,模拟人脑的机制进行解释并分析学习图像、语音、文本等数据。”[6]对以文字处理为基本内容的出版活动来说,深度学习技术是一个发展契机。机器可在分析提炼源数据后迁移到其他语言或文本,从而具备转换和生成文字的能力。
在全球化不断深入的今天,由语言导致的沟通障碍日益突出。尽管翻译出版为读者了解外部信息提供了渠道,但在巨大的信息流面前其效果仍然有限。加之翻译人才匮乏、出版周期长等问题,国内的出版成果走出去不顺畅,国外的出版成果引进来也不及时,最终导致国内外的信息传播出现错位和脱节。目前已有企业开始尝试让机器从事翻译出版工作,使问题的解决迎来转机。2018年4月,网易有道公司联合电子工业出版社出版的《极简区块链》亮相北京图书国际博览会。这一号称全球首部由AI机器完成翻译、人工审校的图书,共320页20万字,从输入原文到翻译输出用时不到半分钟[7]。
相较于翻译图书,人工智能对写作新闻更加热衷。在新闻出版行业,写作机器人已不是新鲜事物。例如在国内有新华社的“快笔小新”、今日头条的“张小明”、腾讯的“Dreamwriter”,在国外有美联社的“Wordsmith”、《华盛顿邮报》的“Heliograf”以及《洛杉矶时报》的“Quakebot”。自动化写作服务商Narrative Science的首席技术官克里斯蒂安·哈蒙德(Kristian Hammond)甚至曾大胆预测,计算机将在未来15年内写作90%的新闻[8]。除了新闻稿,人工智能也可以创作文学作品。2016年,清华大学语音与语言实验中心研发了会写古诗的机器人“薇薇”,并顺利通过“图灵测试”[9]。此前,俄罗斯的AstrelSPb出版社还推出了有史以来第一部由机器人创作的长篇小说《真爱》。在日本,由人工智能创作的短篇小说通过了文学大赛的初选,评审给出的意见是“情节无破绽”[10]。尽管各方对写作机器人尤其是文学写作机器人还存在争议,但不容否认的是,以人工智能生产内容的出版模式已经成型,其利弊还有待后续检验。
(三)自动编校提速编辑加工
AI出版以自动编校取代人工编校,促使编辑职能转变。在现代出版流程中,本已细致琐碎的编辑加工工作变得越加繁重。几十年前,编辑的年发稿指标不过几十万字,到如今年发稿量达几百万字已成常态。从“一人磨一书”到“十书磨一人”,业务量的增加不仅意味着工作效率的提升,对校对质量也是一项挑战。为了给编辑工作减负,20世纪末,已经有专门的校对软件投放市场,如“工智通”和“黑马”。随着机器校稿走向规范,2004年的《图书校对工作基本规程》列入了“二三连校”的“人机结合校对”模式,即“人工一校—改版—机器二校—人工三校—改版—通读检查—付印”[11]。计算机校稿速度快,对错字、漏字、多字、标点错误、格式错误等基础问题的识别度较高,但在专业化领域的灵活度不够,如无法对数字符号、图表公式进行有效识别,后续的检查核对工作仍然不轻松。
人工智能进入出版行业后,校稿机器智能学习语言数据库,将具备较强的语义分析和词汇联系能力,使编校质效进一步提升。方正电子和北京印刷学院合力研发的“智能审校系统”在这一方面进行了有益尝试。该系统从“词汇级的检校、基于规则匹配及相似性算法的检校、基于深度学习算法的检校以及基于自然语言技术进行语义层的检校”[12]等不同层级入手,既能降低审校门槛,又能提高准确度。龙源期刊网旗下的“知识树”也是自动编校的先驱,只要编辑定义一部分内容,系统就能自动组成剩下的内容。在“知识树”的帮助下,一个半小时编辑一本书将成为现实[13]。
人工智能在图书设计上同样大有可为。全球最大的设计软件公司Adobe在2017年推出的Adobe Sensei平台已开始将机器学习和图像识别应用到平面网页设计中,为不同用户匹配不同的文案和图片内容。或许在不久的将来,通过收集文字、主题、受众、预算等信息,人工智能也能自动生成图书封面和版式,为用户提供个性化的编辑定制服务。例如在编排少儿图书时,计算机程序会确定活泼生动的风格,配色鲜明,适量增加插图,选用较大的字号和行距。而在学术读物的编排中又会保持低调严谨,版面干净利落,尽量不用过多的装饰干扰读者的注意力。在AI出版的编辑加工过程中,编辑逐渐摆脱烦琐的工作内容转向对主题、思想等大方向的把控。面对人工智能带来的新技术环境,编辑的职能和价值需要被重新定位。
(四)市场导向定位印刷发行
AI出版以市场为导向,提升印刷发行策略,重塑出版商业模式。对于传统出版企业,如何根据目标读者的消费需求、阅读偏好、人口学特征制定合理的印刷量是一个棘手的问题。印量一旦过高,有可能导致图书滞销,减缓流动资金的周转速度。印量偏低,分摊到每本书的成本又会增加,抬高书价。《2017年全国新闻出版业基本情况》显示:当年度全国出版物年末总库存的价值高达1 220.97亿元,占到了出版物总销售额的四成以上[14]。平衡市场供需关系,推动出版业供给侧结构性改革已成为众多出版企业的当务之急。AI出版结合大数据和按需印刷技术,以“智”促管,以需定产,达到去产能、去库存、降成本、补短板的目的。例如,由印刷机供应商高斯中国推出的“汇印e家智能化平台”,以智慧化印刷管理为特色,可实现远程化操纵,通过物联网自动采集印刷设备的实时数据,再由人工智能分析处理,帮助企业优化印刷方案,快速对接市场需求。中国图书进出口(集团)总公司启动“中国图书全球按需印刷”项目,通过自主建立的“按需印刷中心”以及全球最大按需印刷服务商英格拉姆(Ingram Content Group Company)的技术支持和销售网络,可实现中国图书的24小时全球直供[15]。
人工智能丰富了出版物形态,满足了不同的阅读需求。借助精准的大数据算法和多样的信息反馈渠道,出版企业可实行个性化推送,用户也能定制内容。以用户为中心的精细化、分众化出版营销模式引领全新的阅读和生活方式。目前,VR/AR出版物成为出版融合的新方向。幼儿学习读物、少年科普读物是发展的主力军。此类图书融视觉、听觉、触觉等多种感官体验于一身,创造了交互式、沉浸式的阅读体验,极大满足了少年儿童的求知欲和好奇心。像北京少年儿童出版社的《恐龙世界大冒险》、中信出版社的《科学跑出来》系列、北京联合出版公司的《艾布可的立体笔记》均有不错的市场反响。教育出版也尝试引入人工智能技术。2017年,中国最大的智能语音技术商科大讯飞发布了六款智慧教育产品,涉及微课录制、纸笔课堂、教师组卷、智能批改、课后学习、智能翻译等内容。通过该公司的学业数据采集平台,学生可以制定自主决策、自由创造的个性化学习方案。据悉,已有近20家出版社与之展开合作,计划将该项技术运用于教辅产品中[16]。一些概念型出版物正在逐步推出中,例如由中国大百科全书出版社与中国科学院合作研发的百科全书机器人“司南君”,存储了《中国大百科全书》的所有信息,能实现人机问答互动。
三、AI出版发展的三重瓶颈尽管AI出版为出版人描绘了美好的发展图景,但出于各种原因,人工智能还没有完全付诸出版实践。当前,AI出版的影响力更多地存在于各方的热烈讨论和展望中,其对出版业的全局性影响还未显现。从现实来看,人工智能、出版人才、伦理法律是AI出版面临的主要三重瓶颈。
(一)弱智能限制出版自动化
AI出版诞生于人工智能的第三次热潮,人工智能直接关乎AI出版的发展水平。人类研发人工智能的目的是模拟和延伸人类智能,以便更好地为自身服务。人类智能是目前地球上所见的最高级、最复杂的智能,它帮助人认识和改造世界,主要分为显性智能和隐形智能。显性智能是“解决问题的能力”,“主要依赖于获取信息、提炼知识、创生策略和执行策略等外显能力”。隐形智能是“发现问题和定义问题的能力,是人类创造力的第一要素”,“主要依赖于人类的目的、知识、直觉、临场感、理解力、想象力、灵感、顿悟和审美能力等内秉品质”[17]。目前的人工智能还处于追赶显性智能的弱智能水平,可以依靠整理和分析数据来解决问题,但还不具备推理甚至思考的能力。
弱智能水平的AI出版只是将各项出版流程转换为计算机运算中的“0”和“1”,电脑程序并不理解自己工作的真正含义。这就导致了AI出版的某些局限,损害其市场竞争力。如机器不擅长翻译非常规结构的语句,难以处理语法、修辞和语气,对谚语、俚语、成语的翻译常令人啼笑皆非,更遑论诗歌、小说等文学作品。机器写作的本质也只是对代码和程序的排列组合,无法植入感情,更缺乏人文关怀。在现有的技术条件下,人工智能可以取代出版活动中某些机械性、重复性的工作,也可以参与或主导某些决策性工作,但还不能实现完全的出版自动化。出版业要想迎来真正的“解放”,需要人工智能的持续发展和完善。
(二)专业出版人才建设乏力
出版资源数据库是AI出版的运作基础,在理想状态下,它必须囊括出版产业链的所有信息。但现实情况是,传统出版企业建立和利用出版资源数据库的过程中存在许多问题。尽管他们拥有获取市场和消费者信息的便利,但缺乏对各项信息进行数据化的方法。因数据规模过于庞大,整理优化变得相对困难。而软件程序的缺乏又会阻碍数据的开发和利用。出版企业的大数据难题,说到底还是人才难题,专业出版人才的缺乏限制了传统出版与人工智能的融合。
“十三五”以来,建设“数字中国”已成为国家的重大战略部署。《新闻出版广播影视“十三五”发展规划》要求:到“十三五”年末,数字出版营业收入要达到9 600亿元,年均增速不低于17%[18]。以数字人才驱动行业发展为出版业建设“数字中国”提供了有利支撑。然而数字出版人才建设中的一些突出矛盾,阻碍了技术引进和产业升级。调查显示,“我国数字出版从业人员主要由传统的编辑转岗而来”,“有71.53%的单位数字出版人才规模比例低于10%,超过50%的机构认为当前我国数字出版人才成长空间有限”[19]。真正精通数字出版的传统出版社并不太多,更何况AI出版这样的最新出版形式。出版企业和相关管理部门需要引进和发展一批面向出版业未来发展的高端型、专门型人才,为AI出版从探索变为常态铺路。
(三)生产方式触及伦理法律边界
人工智能参与选题策划和编辑加工过程,可能会造成编辑与机器、文化与经济的对立,挑战传统出版伦理。一直以来,编辑在出版活动中占有主体地位,对于出版物的内容筛选、社会影响负有重要职责。以机器部分取代编辑,动摇了编辑的职责体系和价值体系,打破了传统出版的生态平衡。另外,由于大数据分析的引入,市场和用户的重要性上升,经济效益当先等问题将更为凸显,降低出版物的文化价值。出版伦理与人工智能之间将经历一段相互博弈和不断妥协的过程。
AI出版主要依靠网络爬虫抓取数据,可能会引发侵犯隐私权的问题。如果未经目标用户授权,随意窃取网页浏览记录、购物消费记录、社交聊天记录、语音通话记录等信息,会严重损害个人隐私。机器创作文本的著作权归属也存在争议。根据《中华人民共和国著作权法》,著作权人包括“作者”和“其他依照本法享有著作权的公民、法人或者其他组织”。写作机器人虽是作者,但并非自然人,所以并不享有著作权。那么机器出版物的著作权理应属于机器的所有者,即出版企业。不过写作机器人的核心程序又是由软件人员开发写成的,其知识产权可能属于某家技术公司,而不属于应用该程序的出版企业[20],著作权的归属变得更加复杂。机器人写作是基于原文本的再创作行为,是对现有创作资源的组合利用,这一过程是否构成侵权也值得商榷。例如国内曾颇受关注的第一部人工智能诗集《阳光失了玻璃窗》,就是机器诗人微软“小冰”对1920年以来的519位中国现代诗人作品模仿的结果。因为此类出版物的著作权认定属于法律空白,有关讨论还将持续。
四、思考与展望在人类历史上,技术变革总能在出版行业引发二次效应。造纸术的发明降低了书写成本,书籍由此摆脱笨重的形式。印刷术的发明加速了书籍流通,使知识的大范围传播变成可能。电子技术的发明让出版彻底告别铅与火,走向光与电。我们无法预估人工智能是否会在出版行业掀起一场新革命,不过AI出版的诞生确实让我们多了一项选择。出版企业要以积极开放的态度、创新务实的方法应对人工智能的机遇和挑战,助推AI出版发展。
首先,要稳步尝试,把握AI出版的发展机遇。人工智能的发展大潮来势汹汹,与其坐以待毙,不如适时跟进。从短期看,出版企业可从AR/VR图书等市场接受度高的出版物入手,以较低的投资风险换取成功经验。从中长期看,待AI出版模式成熟后,可尝试推动人工智能与传统出版在决策、内容、印刷、发行方面的深度融合。当然,融合的前提是出版企业对人工智能有足够了解并合理评估市场现状。AI出版是一块诱人的蛋糕,如果盲目推进可能会得不偿失。在数字出版的发展初期,因步子迈得太快而留下的教训不在少数。人工智能前景无限,但市场上炒作概念、伪创新泛滥的现象比比皆是,《人民日报》也曾专门发文批评人工智能泡沫。出版人应理智看待“人工智能热”,擦亮双眼,去伪存真,既不错失机会,也不盲目跟风,让人工智能真正造福出版业。
其次,要提供优质内容,增强AI出版的竞争力。在弱人工智能阶段,作为人类精神文化堡垒的出版事业不会被机器轻易攻占。2017年,BBC基于剑桥大学研究者的数据体系,分析了365种职业在未来的“被淘汰概率”,其中编辑被人工智能取代的概率仅为8.4%。如果预测准确,出版业界对“科技性失业”的焦虑或许可以得到暂时缓解。以先进技术淘汰落后的生产方式,是社会进步的必然要求。但出版活动某些核心要素,如创意能力、审美意识、社会责任感等人文思维仍具有不可替代性。它们共同构成了出版行业的精神底色,是企业生产优质内容的重要动力。而内容又是出版企业的核心竞争力,科技愈发展,其重要性也愈突出。人工智能时代的出版业竞争根本上还是出版内容思想性的竞争,即人文思维的竞争。这不在弱人工智能的应对范围之内,属于AI出版的劣势。所以,将原创性内容与人工智能的技术优势结合起来是有必要的。出版企业在降低管理成本和时间成本的同时,提高了出版物质量,也使AI出版的模式得到了推广应用。
最后,要加强出版队伍建设,激活AI出版的潜力。出版企业可联合大数据公司建立数据库,实现资源共享,以外部力量弥补内部人才缺口。像人民出版社、中国财经出版传媒集团、人民卫生出版社等已率先与AI技术公司展开合作,推动出版社向基于大数据的知识服务商转变。与此同时,要开展产学研合作,提升从业者的业务能力,使之成为既深谙人工智能,也具备编辑出版技能的综合性人才。2016年,国家新闻出版广电总局公布了首批42家“新闻出版业科技与标准重点实验室”名单。这些实验室采用高等院校、科研院所与出版企业联合共建的模式,涵盖生产技术、数据挖掘、知识服务、内容呈现、产品营销、版权保护等不同方向,对于提高企业自主创新能力、培养出版人才有积极作用[21]。相应地,AI出版教育应该提上日程。高等院校的编辑出版学专业是培养出版人才的重要基地。如果能完善师资队伍建设,让学生较早接触人工智能的理论知识,将为传统出版的顺利转型提供后备力量。
尽管AI出版面临诸多发展难题,但正如“人工智能之父”图灵在他那篇著名论文《计算机器与智能》(Computing Machinery and Intelligence)的结尾所说的那样:“我们的目光所及,只是不远的前方,但是可以看到,那里有许多工作要做。”[22]AI出版还有许多工作要做,未来可期。
--end--
声明:本文章由网友投稿作为教育分享用途,如有侵权原作者可通过邮件及时和我们联系删除:freemanzk@qq.com