智能语音
立足腾讯社交数据大平台,累积了数十万小时标注语音数据,拥有海量的语言层数据,轻松应对会场语音处理。
能力场景化
针对具体应用场景,结合业务情境,了解用户习惯,构建在场景下有竞争力的基础服务能力。
久经实践考验
法院、会场、会议等多场景,久经客户考验,在全国多省市部署应用,技术性能卓越,服务稳定可靠。
生态开放
面向各行业独立软件开发商、系统集成商、硬件服务厂商,优化基础能力,提供公有云、私有化部署两种服务形式。
会场 AI 典型应用架构解读
挑战:
随着人民法律意识的提高人民法院的案件审理数日益增加,案件处理效率亟待提高。
方案特点:
通过在法庭、合议庭现场应用语音识别,可以将法官、原告、被告等各参会角色的现场发言实时转写成文字笔录。专业法务领域定制化引擎,有效应对法律专业术语。系统识别准确率已经达到95%以上。
人脸核身技术,通过身份证 OCR 识别获得并显示用户身份信息,专线访问身份信息数据源核实用户身份信息的真实性,让庭审前的身份认证工作更加权威高效。
提供通用 OCR 识别功能,支持多种复杂场景、任意版面的图像上的文字识别,可广泛应用在印刷文档、广告图等资料的识别。
大型现场会议
挑战:
在传统电视、网络直播中,字幕需要速记员通过打字方式添加,在直播的延时中迅速配好或后期添加;对于英文发音人更需要聘请昂贵的同声传译人事进行英文到中文的翻译。
方案特点:
通过在会议增加多声道声卡装备,既可在不修改已有系统流程的情况下,对大会现场演讲人进行语音识别。为大型会场环境及采音麦克风定制化引擎,系统识别准确率已经达到95%以上。
机器翻译技术,现场中文/英文语音流经过语音识别转成文本流后,可以通过自动翻译服务,将中文/英文文本自动翻译成英文/中文。
远程会议
挑战:
随着科技的高速发展,越来越多的商务会议趋于无纸化和智能化,会议的效率和有效性需要得到提升。
方案特点:
通过会议系统的视频录制设备,采集人脸高清图片,实现自动签到,自动记录与会时长功能,提升会议效率。
直播及即时消息模块,实现异地多方参与人的实时互动,包括文件传输及共享屏幕等,增加互动方式,提高有效性。
语音识别服务,让发言内容更直观地展示,保证嘈杂或静音环境下与会者的参会效果。
文智自然语言处理服务,能够根据会议纪要自动生成会议摘要,方便检索和管理。
使用场景
教育
随着 K12 课外辅导及成人在职教育的快速发展,通过直播完成授课成为了辅导机构的新型商业模式。人脸核身技术在直播课程开始前,有效验证课程购买者的身份有效性。语音识别服务,能够实时将讲师的发言转成文字形成字幕,让不方便收听语音的学员可以完成学习,同时提升其他学员的学习效率。
义务及高等教育课程
中小学及高等教育学府实时视频监控设施不断完善,为人脸自动签到提供了硬件基础设施的支撑。老师不再需要点名,让课堂签到自动智能。多媒体教室可以完成教师授课的音视频留存,语音识别服务可以根据音频自动生成讲稿,方便学生温习回顾。
公安和检察院
数字审讯
人脸识别 + 声纹识别功能,让系统权限管理更安全更智能。语音识别技术,能够自动生成审讯笔录,大大降低侦查审讯人员的工作复杂度,实现审讯过程的百分比还原。
智能指挥中心
包括城市街区、地标点、管线设施等在内的城市全景进行完整的呈现,并通过接入相关部门数据,集成视频监控、警力警情数据为一体,可以综合了解警情、警力信息,合理布局警力分布,为实时现场指挥提供重要决策依据。
相关产品
腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、法庭/审讯记录、语音输入法等多个场景。
数据万象
万象优图(Cloud Image)为开发者提供图片智能鉴黄、图片内容识别、人脸识别、OCR 识别等服务;也可根据需求提供定制化图片识别服务;也提供灵活的图像编辑服务,如裁剪、压缩,水印等,满足各种业务场景图片需求。
大数据可视化服务
腾讯云大数据实时可视交互系统(RayData),基于数据实时渲染技术,利用各种技术从大规模数据通过本系统,实现云数据实时图形可视化、场景化以及实时交互,让使用者更加方便地进行数据的个性化管理与使用。
机器翻译
腾讯机器翻译(Tencent Machine Translation)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持中英双语互译。