当前位置:» 商务服务 » 财务服务 » 其他咨询 » 中文分词提升人工智能“自我学”

中文分词提升人工智能“自我学”

更新时间:2016-09-19 14:09:46 信息编号:2519908 浏览:1次
  • 供应商

    灵玖中科软件(北京)有限公司 商铺

  • 认证 营业执照已认证
  • 报价面议
  • 最小起订大量
  • 发货期限自付款之日起0日内发货
  • 供应能力件/每月
  • 样品不提供
  • 所在地北京市海淀区中关村甲331楼14层B座3门1229号(住宅)
  • 联系电话010-62648216
  • 手机号15801695527
  • 联系人张先生
咨询其他咨询 产品,请说在传众网看见,优惠多多

 

产品详情

人工智能随着互联网和大数据的快速发展,已经悄悄进入到我们的生活,如语音识别、人脸识别、机器人、无人驾驶等人工智能技术均取得了突破性进展。而人工智能核心的是需要有大量数据处理技术的支持,只有的大数据处理技术才能对大量的数据进行抓取、分类、归档等处理并通过人工智能设备表现出来,同时提升人工智能自身的机器学训练能力。文本分析作为基础的大数据处理技术对人工智能的发展起到非常重要的作用。

目前,文本分析技术受到越来越多的关注,在分析效果和表现形式上灵玖软件NLPIR 大数据搜索与挖掘共享开发系统是的, 灵玖软件NLPIR大数据搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术。NLPIR开发平台系统由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,下面介绍一下系统中主要的功能: 

    1、汉语词法分析功能:

  汉语词法分析中间件能对汉语语言进行拆分处理,是中文信息处理的核心部件。 NLPIR 大数据搜索与挖掘共享开发平台系统综合了各家所长,采用条件随机场(Conditional Random Field,简称 CRF)模型,分词率接近 99%,具备率高、速度快、可适应性强 等优势;特色功能包括:切分粒度可调整,融合 20 余部行业专有词典,支持用户自定义词典等。 词性标注能对汉语语言进行词性的自动标注,它能够理解中文,自动根据语言环境将词语 诸如“建设”标注为“名词”或“动词”。

    2、新词自动发现功能:

  新词自动发现技术能够识别出词典中没有出现过的词汇、短语、命名实体、流行用语, 是语言文献分析方面的一把利器。新词发现脱胎于语言自动分词技术,又是对分词技术的 提升和补充。

    NLPIR 大数据搜索与挖掘共享开发平台采用基于语义的统计语言模型,所处理的文档不 受行业领域限制,能够地挖掘出新出现的特征词汇,所输出的词汇可以配以权重。新词发现组件可以应用于文本挖掘、知识管理、词典编辑、舆情监测等多种应用中。

    3、文本内容去重功能:

  文本内容去重中间件能够对文本进行查重处理,同时能找出所有的重复文件。能够快速准 确地判断文件集合或数据库中是否存在相同或相似内容的记录。 NLPIR 大数据搜索与挖掘共 享开发平台采用的文章指纹算法,能够在极短的时间内与历史指纹库进行对比,从而发现 重复记录。

    4、文本分类过滤功能:

  文本分类中间件能够根据文献内容进行类别的划分,可以用于新闻分类、简历分类、邮件 分类、办公文档分类、区域分类等诸多应用。

  文本过滤功能能够从大量文本中快速识别和过滤出符合特殊要求的信息,可应用于品牌报 道监测、垃圾信息屏蔽、敏感信息审查等领域。

NLPIR 大数据搜索与挖掘共享开发平台采用基于内容的文本自动分类过滤和基于规则的 文本分类过滤两种方式,并支持两种方式的混合分类。能够进行多级分类,分类速度每秒 100 篇以上,平均率 90%以上,能够进行中英文分类和中英文的混合分类。用户可以灵活、 方便的更换模板,来实现对不同的主题的分类过滤。

    5、文本聚类功能:

  文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容 相近的文档归为一类,并自动为该类生成标题和主题词。适用于自动生成热点舆论专题、重大 新闻事件追踪、情报的可视化分析等诸多应用。 NLPIR 大数据搜索与挖掘共享开发平台基于文章集合核心语义理解技术,不仅聚类速度 快,而且率高,并能自动得到类别间的演化趋势。

    6、文档关键词提取功能:

  文章关键词提取中间件能够在全面把握文章的中心思想的基础上,提取出若干个代表文 章语义内容的词汇或短语,相关结果可用于精化阅读、语义查询和快速匹配等。

  采用基于语义的统计语言模型,所处理的文档不受行业领域限制,且能够识别出出 现的新词语,所输出的词语可以配以权重。

NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。

  因此,通过科学的大数据处理技术读取大量的计算机数据,提升人工智能本身的能力/度。如今,大量数据产生之后,有成本的存储器将其存储,有高速的CPU对其进行处理,所以可以进行人工智能自我学实践。由此,人工智能能做出接近人类的处理或者判断,提升度。同时,采用人工智能的服务作为高附加值服务,成为了获取更多用户的主要因素,而不断增加的用户,产生更多的数据,使得人工智能进一步优化。

  目前人工智能、机器学算法在工业界里应用比较好的领域,也是用户量很大、有大量的学样本和训练数据的领域。在应用的过程中能够给出算法的评价,形成闭环,不断地改进优化。

产品关键词: 其他咨询
产品所属分类: 商务服务/ 财务服务/ 其他咨询
企业介绍
灵玖软件全称灵玖中科软件(北京)有限公司(LING-JOIN),专注于大数据搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析并从大数据中获知识与智慧,将用户的大数据困境转变为大数据宝藏。灵玖软件大数据搜索与挖掘技术已经应用于全球二十余万家机构,包括统计局、中国证监会、中国邮政集团、气象局、新闻办公室、人民法院等单位,中国上市公司协会、中国对外承包工程商会、北京市园林局、解放军某部等事业与机关,以及海航集团、上海电信、中国网、富基融通eFuture、四维图新、缔元信等大中型企业。 灵玖软件作为大数据搜索挖掘技术创新的,拥有知识产权局颁发的著作权十余项,是高新技术企业(证书编号:GR201011000707),并通过了ISO9001:2008 GB/T 19001-2008质量体系认证(编号为064-12-Q-0296-RO-S)、北京市双软认证(编号为京R2010-0240),中关村高新技术企业(编号为:20102011332101),中国软件行业协会会员。2011入选中小企业创新基金计划(编号为11Z075);灵玖团队入选浙江舟山“千人计划”;灵玖软件先后获得了河北省科技支撑计划、新疆自治区科技支撑计划等科研攻关项目。 灵玖软件与中国科学院、北京理工大学与新疆大学等知名科研机构建有联合科研开发基地,汇聚了国际管理专才与技术专家,灵玖软件高管胡博士为美籍华裔,是享誉海内外的工商管理与金融学专家,担任美联储金融专家,是美国中央银行的位华裔专家,目前在长江商学院担任兼职教授。灵玖软件大数据挖掘总监于博士来自中国科学院,有着10余年大数据研究与开发经历,主持开发的大数据采集挖掘系统广泛地应用于公安部、中国移动与中国证监会等单位;大数据搜索处理技术总监刘博士毕业于美国芝加哥大学,曾在全球TREC文本检索大赛等多项比赛中折冠;并联合培训养了维哈柯等多民族语言处理方面的博士;大数据自然语言处理技术总监许博士毕业于日本北海道大学,曾在日本NEC等多家企业任职十余年,研制的中日机器翻译以及语音识别技术已经投入运营多年。
联系方式
灵玖中科软件(北京)有限公司
手 机 : 15801695527
电 话 : 010-62648216
Email : 2794994234@qq.com
Q Q : 2794994234
地 址 : 北京市海淀区中关村甲331楼14层B座3门1229号(住宅)
邮 编 : 100080
传众商铺 : 3666612.czvv.com

快捷留言

*您的称呼:
*您的电话:
Email:
*咨询内容:
您也可以通过点击此处发布您的采购需求让产品供应商主动联系您!
免责声明:
中文分词提升人工智能“自我学”产品由灵玖中科软件(北京)有限公司自行上传维护,内容的真实性、准确性、合法性由发布企业负责,传众对此不承担任何保证责任!
© 2024 传众  czvv.com