客座教授、研究员

当前位置: 首页 -> 师资队伍 -> 客座教授、研究员 -> 正文

颜永红 客座教授

来源: 时间:23-07-26 16:58:16 作者: 点击:


1.基本情况

1.1简况

岗位类别

客座教授

学科领域

船舶与海洋工程

姓名

颜永红

性别

国籍

中国

出生年月

1967.03

最终学位

博士

毕业学校

Oregon Graduate Institute of Science & Technology

行政职务

中国科学院声学研究所首席科学家

现工作单位

中国科学院声学研究所

从事专业

水下目标识别与定位、声学大数据分析、自动语音识别

1.2主要学术荣誉

1.2007年,入选新世纪百千万人才工程国家级人选;

2.2008年,获中科院朱李月华优秀教师奖;

3.2009年,获国家自然基金委国家杰出青年基金(语音行业第一位);

4.2010年,获中国声学学会马大猷奖;

5.2013年,获新疆自治区科技进步一等奖两项(排名第一和第二);

6.2014年,获中科院杰出科技成就奖;

7.2016年,获国家科技进步二等奖(排名第八);

8.2016年,中国科协第七届“全国优秀科技工作者”称号;

9.2019年,获北京市科技进步二等奖。

曾任美国俄勒冈研究院口语研究中心副主任、副教授,英特尔中国研究中心主任和首席科学家、英特尔全球人机界面学术委员会主席等职务。

现任中国科学院声学研究所首席科学家,担任中科院“面向感知中国的下一代信息技术研究”战略性先导专项之“媒体内容理解和大数据处理”项目负责人,国家自然科学基金委员会重大项目“多语言言语识别基础理论与建模方法”项目负责人。

2009年,承担了语音行业首个国家自然基金委国家杰出青年基金“面向语音处理的言语声学数字化建模”,主要研究了语音信号与信息处理,包括语言声学,发音建模,声学建模和语音识别等以及相关应用。通过把语言声学的研究成果用于指导语音处理的新方法,提出了适合计算机处理的数字化特征及其建模,来推动音频处理,特别是语音识别等核心技术的发展。项目研究成果在多个国家级工程项目中得到实际应用并发挥了重要作用;在民用市场,通过与国内外企业(如互联网龙头企业百度、腾讯和阿里巴巴等)的合作,亦得到了规模化应用。

其率领团队研发的新一代自主可控语音信息处理平台性能先进,支持高效训练与推理部署,面向通用智能技术设计研发,对多领域具有广泛的辐射作用。打破国外在语音核心技术平台上的垄断地位。在国家数个省部得到规模应用。2019年,该平台在客服领域的应用获得北京市科技进步二等奖一项。

1.3主要学术兼职

1. “中国声学学会”常务理事及“语音、听觉与音乐声学分会”主任;

2. 《应用声学》副主编,《声学学报》编委,以及十余个国际主要期刊的审稿专家;

3中国科学院大学本科生学业导师。

1.4主要学术成就

美国学习工作期间在语种识别、基于神经网络的语音识别和听感知方面的研究成果得到国际同行的广泛引用和高度评价,所提出的系统架构至今在大多数NIST语种参赛系统和基于深度神经网络的语音识别系统中应用。曾在美国国防部DARPA和标准局(NIST)举办的语音评测中三次获世界第一(1995,19962001)。在英特尔公司工作期间领导了英特尔性能库(IPP)信号处理部分的研发,于2000年获英特尔发明家奖。

2002年加入中科院声学所后在水声目标识别和定位、声学建模、多语言听觉感知、音频水印、说话人识别、音信号处理与识别、关键词检测和连续语音识别等方面取得了一系列的成果,在本领域国际顶级期刊和学术会议发表论文60余篇。

在水声目标识别方面,结合声学信息处理以及深度学习识别研究的经验,自2018年起尝试将人工智能应用于水声领域,针对复杂水下环境目标定位与识别领域的难题,率先提出了人工智能与水声物理相结合系统性探索水下目标定位与识别的新途径,并在声学领域顶级期刊JASA、IEEE上发表多篇文章,在国内外取得了较广的学术影响。

在音频识别方面,提出了基于发音动作的长时特征,更为精确地描述了音位,基于此研发的普通话发音质量评估系统已实际应用于香港理工大学的普通话水平考试,成果被包括国家语委成员在内的专家组鉴定为国际领先。该成果也应用于新疆双语教学系统,2013年在和田、喀什、阿克苏等地200多所学校2200多个双语班级的课堂教学中进行应用,取得了良好的社会效益。提出了以音频指纹、语音识别和语种识别为核心的系统方案,解决了特定媒体内容发现难的问题,并降低了计算复杂度,在近年来国家相关工程中得到广泛应用。

整合团队在信号处理、语音识别和理解的研究成果,构建了完整的智能语音识别平台,2010年和百度合作推出了国内第一个语音识别云服务(掌上百度的语音搜索),2011年和腾讯合作推出了国内第一个即时通信的语音输入法(QQ),2013年和阿里巴巴合作推出了国内第一个智能客服系统,2014年和海信合作推出了国内第一台基于远讲语音交互的智能电视,引领了语音识别应用在民用市场的推广普及。

从事声学信息研究30年,在水声目标分类识别、音频信号处理、语音识别、基于声学的大数据分析等领域共发表学术论文300余篇,持有110余项发明专利(其中美国发明专利10项,中国发明专利100余项)。先后主持了国家863专项、科技支撑项目、国家自然科学基金委员会重大项目等十余个国家项目。

2.主要经历

2.1教育经历

起止年月

学  校

学  位

1985.09-1990.07

清华大学

学士

1990.09-1995.08

Oregon Graduate Institute of Science & Technology

博士

2.2工作经历

起止年月

工作单位

职务、职称

1990.06-1992.08

北京星河电子公司

系统工程师及非特定人语音识别课题组组长

1995.08-1996.06

Oregon Graduate Institute of Science & Technology

Research Scientist

1996.07-1998.07

Oregon Graduate Institute of Science & Technology

Assistant Professor

1998.08-2004.06

Oregon Graduate Institute of Science & Technology

Associate Professor

1998.12-2001.04

英特尔公司

英特尔全球人机界面学术委员会主席,中国研究中心主任和首席科学家, 英特尔微处理器实验室人机界面总框架师

2002.02-2021.08

中国科学院声学研究所

研究员,博士生导师,实验室主任

2021.09-至今

中国科学院声学研究所

研究员,博士生导师,声学研究所首席科学家









上一条:Carlos Guedes Soares 客座教授

下一条:宇波 客座教授

地址: 江苏省太仓市太仓大道127号

电话:0512-53331590

邮编: 215400

邮箱: haiyang2022@nwpu.edu.cn

传真: 0512-53331594