基于大数据和用户行为的分词、词性标注、命名实体识别,定位基本语言元素,消除歧义,支撑自然语言的准确理解
功能介绍
通用版包含中文分词、词性标注、命名实体识别三大基础功能
中文分词
将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列
词性标注
为自然语言文本中的每个词汇赋予一个词性,例如名词、动词、形容词等
命名实体识别
识别自然语言文本中具有特定意义的实体,主要包括人名、地名、机构名、时间日期
功能演示
语音指令解析
以分词和词性标注为基础,分析语音命令中的关键名词、动词、数量、时间等,准确理解命令的含义,提高用户体验
多轮交互式搜索
通过专名识别定位多轮对话中的核心实体,自动判断后续对话中对该实体的进一步信息需求
法律术语识别
分析处理法律案由与案例信息,提取法律行业专业术语做信息结构化
新闻人物信息提取
以定制词表为基础,提取新闻源中涉及到的参会代表的人名和机构名、职务等,进行精准匹配,为所有参会代表提供专属的新闻档案
品牌舆情信息提取
通过定制化词法分析,准确定位网络文章中的品牌舆情关键词,并通过词性判断提炼出与品牌词强关联的话题,助力品牌舆情监测及社交推广参考
技术特色
粒度更灵活
模型既保证了基本词汇的原子性,又保证了大粒度词汇,对领域新词、专有名词的识别尤其有效
海量数据建模
海量训练样本,百亿级的点击反馈,提高了算法在复杂多变的应用场景下的效果稳定性和适配性
支持交流
新手指南
找到适合您业务的AI技术能力,快速创建应用,开始便捷的开发之旅
技术文档
针对使用API或SDK的开发者,提供百度自然语言处理开发文档
常见问题
词法分析可以识别出多少种实体?中文分词效果如何?
地址识别
精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业效率
依存句法分析
自动分析文本中的依存句法结构信息,实现对自然语言的精准理解
零门槛AI开发自助平台
零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成