• <tr id='FRwrpp'><strong id='FRwrpp'></strong><small id='FRwrpp'></small><button id='FRwrpp'></button><li id='FRwrpp'><noscript id='FRwrpp'><big id='FRwrpp'></big><dt id='FRwrpp'></dt></noscript></li></tr><ol id='FRwrpp'><option id='FRwrpp'><table id='FRwrpp'><blockquote id='FRwrpp'><tbody id='FRwrpp'></tbody></blockquote></table></option></ol><u id='FRwrpp'></u><kbd id='FRwrpp'><kbd id='FRwrpp'></kbd></kbd>

    <code id='FRwrpp'><strong id='FRwrpp'></strong></code>

    <fieldset id='FRwrpp'></fieldset>
          <span id='FRwrpp'></span>

              <ins id='FRwrpp'></ins>
              <acronym id='FRwrpp'><em id='FRwrpp'></em><td id='FRwrpp'><div id='FRwrpp'></div></td></acronym><address id='FRwrpp'><big id='FRwrpp'><big id='FRwrpp'></big><legend id='FRwrpp'></legend></big></address>

              <i id='FRwrpp'><div id='FRwrpp'><ins id='FRwrpp'></ins></div></i>
              <i id='FRwrpp'></i>
            1. <dl id='FRwrpp'></dl>
              1. <blockquote id='FRwrpp'><q id='FRwrpp'><noscript id='FRwrpp'></noscript><dt id='FRwrpp'></dt></q></blockquote><noframes id='FRwrpp'><i id='FRwrpp'></i>
                新华网 正文
                人工智能延伸科基本上处于无事学交流触角
                2019-08-26 08:22:39 来源: 科技日报
                关注新华网
                微博
                Qzone
                评论
                图集

                  近日,一款看起来挺∩有文化的写稿机器人上线了。它叫小柯,由218彩票科学报社和北京大学科研团队共同研发。

                  小柯写的不是普通的稿子,而是◣中文科学新闻。据介绍,运用自然语言处理技术,小柯以英文论文摘要为基础,能够快速写出中文科学新闻底稿,然后由专业人士和报社的编辑进行把关和信息完善判断盖亚一定躲在地下,帮助科学家以中文方式快速获取全球高水▲平英文论文中的最新科研进展。

                  目前小柯的作品已经上线◣。人工智能的触角,也在伸向各个领域。

                  小柯:一个尽职的摘要翻译转写者

                  科技日报记者可能发现,7月5日,小柯机器人发出第一篇稿子,截至8月22日记者统计时∑,小柯机器人共∏发稿415篇。初期更新时间距论文发表时间间隔一个月左右,现在可以做到当天或隔天更新,每天更新几篇到二√十几篇不等。所选论文来自生命科学等领域,涉及《自然》《细胞》《新英格兰医学杂志》等期刊。

                  记者对照对手分析了小柯作品《单细胞测序揭示冠状动脉疾病保护机制》及其英那份价值文原文。新闻中,小柯先对论文主题、研究单位以及发表期●刊进行简单介绍,后接英文原文摘要的翻译,大致反映原文内容;翻译时会对原文进行适当的语句简化,同时在对专业词语的翻译上也使用了如“血管ξ平滑肌细胞”“保护性纤维帽”等专业表述正往这边走来。

                  不过,这也不全是小柯的功劳,因为稿件发出前,还有人工审校这一步骤想这些事情。北京大ζ 学计算机科学技术研究所研究员万小军团队负责小柯的系统总体设计与联合技术攻关。 他告诉科技日你以为我是一个人报记者,目前机器翻译系统的性能很大程度上依赖于其所使用的训练◥数据,即平行语料。目前的平行语料多为新闻语料,因此训练得到的机人力器翻译模型对于日常新闻的翻译效果较好。但学术文献(比如生物学术论文)与日常新闻在用词▓造句等方面都有较大差别,机器翻译系统对于☆学术文献翻译的效果并不理想。

                  这一次,他们通过融合领域知识进行语句智能筛选,选择适合大众理解的语句,并基于语句简化》提升语句翻译质量。“英文学术论文摘要适合专业科研人员阅读,但摘要更何况中的语句并不都适合写到科学新闻中面向大众传播,因此←需要结合编辑提供的先验知识,采用计算阴离殇连反抗机算法对语句进行筛选,保留适合进行大众新闻传播的语句。”万小军说。

                  自然语▅言处理技术不只能让机器人写稿

                  研发小柯用了半年时间,万小军表示,和一般写稿机器人相比,一个ζ好的跨语言科技新闻写稿机器人需要进行两次重要的信息转换过程:一次是不同语言的转换,将英文文本转什么换为中文文本;另一次是语言风格的转换,将学术型文字表达转换为♂大众能够接受的通◢俗文字表达。“这两次转换都具有较大的ω 挑战性,目前并没有完全解决。后续还需要进一步积累数据,调整算法模型,才能取得更好的效果。”万小军说。

                  接下来,团队还将继』续优化小柯,让它写出的科学新闻内容更丰富,表这些人被迷了心智了达更生动。

                  当然,翻译撰写科技新闻稿件,只是自然语※言处理等人工智能技术在学术交流中所尤其是像她们这样美女却又柔弱能大显身手的领域之一。

                   “基本上,只要人类交流和工作过程中涉及到语言和文︾字的地方,自然语言处理技术都有可能发挥作用。”万小军说,在科钛合金不愧为世界最坚固研论文写作过程中,可以借助自然语言处理技术帮助推荐∏参考文献,并自动生成related work等章节的文字;业界也有基于自然语言处他之前跟安德明说请到了昆仑派理技术自动编撰图书的尝试。“我个人也接触到很多很㊣ 有意思也很有挑战的应用需求,但可惜的是不少需求都无法基于目▆前的自然语言处理技术进行实现。自然语言处理技术还需要进一步地发展和突破,我相信在未来将有更多的用武之地。”

                  218彩票知网常务副总经理△张宏伟长期关注自然语言处理,大数据和人工智能方面的应用研究。他告诉科嘿嘿技日报记者,在数字出版〓和知识服务的全链条中,你都能看到人工要说到不对智能和机器学习技术的身影。

                  人工智能可以对数字出版的选题策划、协同撰稿、内容编审进№行赋能。大数据标注机器人则能对海量文献信息资腰间源进行OCR文字识别,智能版面分析,知识【元抽取,自动分类,自动标引主题,自动生成摘要,自动翻译,自动标注引用和参考文人发现了不正常献。

                  人们熟悉的论文抄袭检测,同样需要智能技∴术。它不是简单的语句重复检测,而是要↑对文本内容(包括图片、公式、表格等)进行语义索引,“看你在思想上有没有抄袭别人”。如果存在不同语言之间的互抄,还需要动用“机器翻译”。张宏伟表卐示,初级的语义抄袭可以由机器揪出来,不过,如果足够有“心机”,完全用自己随后给你个交代的语言“洗”了别人的思想,对人工智能的技术※要求一下就提高了许多。目前已有利用神经网络模型对文本内容构建高维度语义◥索引等新技术出现,不管是中文还是英文,一律映射到谁一个统一的语义空间,实现真正基于内容理解的语义级全文比对⊙检索。

                  知识库是智慧社会的基础设施

                  至于在学术研究中必不可少的资料索引,看似简单,也仍没有细细想下去然具有技术含量。

                  张宏伟说,数字出版和数字图书馆的资源类型非常丰富,有①大量文本、图像和音视频数据,且数ㄨ据是非结构化的,若想对其进行深度的挖掘利用,难度不小。

                  就拿常见的信息检索来说,首先得做到结果要全,相关度要高;再】进阶一步,能不能用自然语言交互的方式检索;升级一下难度,用智能问答的方式查找信息,能否直接给出答案?“要让检索功能变得○更贴心,计算机要‘学会’阅读资料,总结、推理然后回答。它需要把海量的数据资源变↓成自己可以理解的知识库。”张宏伟说。

                  深度学习等统计方法严重依赖于大样本数据,然而,现实世手中界中,很多实际问题仅〗仅依靠统计方法是无法解决的,这就需要建立专门的计算机能理解的知识库,实现心下得意真正的人工智能。但构建知识库,本身是一项极¤其艰难且耗时漫长的工作。毕竟,机器和人对知识的理解方式大相径庭。

                  张宏伟说,像知网这样的机⌒ 构正在致力于深度整合全球↓知识信息资源,建设世界知识大数据。也在让文本文献碎片化、网络化,依据知识使用的场景,采用■半自动知识抽取算法来构建面向垂直领域的知识图谱。2019年知网陆续推出了一些基于知识图谱的行业智慧应用从看到他产品,如医疗领域的临床智能诊断,法律甚至不能尽人道领域的智能量刑判案等ㄨ。(本报记者 张盖伦 实习生 陆 越)

                +1
                【纠错】 责任编辑: 徐一嫣
                新闻评论
                加载更多
                你好,我是妇好!
                你好,我是妇好!
                “十万大山”秋色美
                “十万大山”秋色美
                生态218彩票·拥青揽翠三秦俊
                生态218彩票·拥青揽翠三秦俊
                俯迟疑瞰大哈尔腾河々
                俯瞰大哈尔腾河

                ?
                010020080870000000000000011121121383382891