(相关资料图)
打开电脑,将采集的风声、雨声、溪流声等声音数据输入,“清洗”掉夹杂其间的噪音,对助听器数据模型进行“训练”,测试模型在真实场景的灵敏度……伴随着手指敲击键盘的“啪嗒啪嗒”声,腾讯天籁实验室人工智能训练师付聪一天的工作就此开始。
近几年,随着人工智能技术不断发展,这个被称为人工智能训练师的职业逐渐壮大。作为“数字职业”之一,人工智能训练师的出现,加速了人工智能由技术研发走向行业应用的过程,将产生较高的经济价值和社会价值。
为模型不断“喂”数据
每次出门时,付聪总会在耳朵上戴一个大“耳环”。
这个“耳环”其实是一个测试版的助听器。“耳环”里的声音各式各样,有呼呼的噪声,有尖锐刺耳的吵闹声……这些经过助听器放大后产生的噪声,是很多佩戴助听器的听障人士长期面临的困扰。
付聪和他的团队正在尝试利用算法设计、通过人工智能技术“训练”数据模型,让助听器更加“智慧”地降低噪声,让听障人群听得清、听得懂、听得舒服。
付聪解释说,助听器数据模型很小,因此需要针对不同场景进行优化,很多场景充满挑战,“比如一个听障人士在餐厅吃饭,周围有很多人说话,他想跟对面的人聊天,四周声音特别嘈杂,作为一个正常人都可能听不清楚,更何况一个有听力障碍的人?我们希望利用模型,把需要的声音提取出来,降低噪声,帮助更多听障人群”。
理想很丰满,但是实际的模型算法研发过程却像是一场反复进行的“战役”。
模型的研发过程大致分为以下几步:数据采集、数据“清洗”、模型训练、场景测试、调整算法,经过几次迭代之后再测试、调整,“如果测试结果不理想,需要把这个过程再走一遍,直到得到最优效果”。付聪说。
数据采集要有针对性。为了让模型更“聪明”,需要针对不同场景采集各种特殊数据。付聪和团队成员不仅需要到早晚高峰的地铁、热闹喧天的餐厅、人来人往的马路等场景,采集数百个小时的声音数据,还要戴上助听器体验这些声音的差别,“比如风声,正常人听到是呼呼声,但戴上助听器以后,是很吵的噗噗声,像是去KTV唱歌,声音使劲砸到麦克风上”。道路骑行、海边风浪……为了采集各种风噪数据,付聪录制了多种场景的风声。
数据“清洗”是将不需要的数据“洗掉”。付聪举了一个例子——风声,真实场景下会夹杂汽车鸣笛、人交谈等声音。在整理时要把这些数据剔除出来,保留一个比较纯粹的风声,这样模型才会“认识”风。
模型训练是将“清洗”好的数据“喂”给模型。除了采集的特殊数据,付聪和他的同事们还会加入诸如世界各国的语言和一些非语音声音等数据,“基本涵盖了人们生活中遇到的所有噪声和语音”。
和人类不同,人工智能模型在训练过程中,不会疲惫、烦躁、发脾气,它们的“智慧”取决于模型参数、训练策略、数据量等。“它们就像一个‘孩子’,会越来越‘聪明’,识别到越来越多的声音,我特别有成就感。”付聪说。
考验耐心、细致和忍受力
模型训练完成后,并不意味立刻能应用到听障人群的助听器上,还要经历较长时间的迭代、调整过程。
比如,为了让听障人群适配到合适的助听器,传统方式是患者反复到线下的验配店去试戴,过程繁杂。付聪解释说,一般情况下,根据发病原因不同可以将听力下降分为三类:感音神经性、传导性、混合性耳聋;根据听力下降的程度不同,分为轻度、中度、重度及极重度耳聋。针对不同的类型,助听器的适配方式有所不同。
有没有可能把适配过程搬到“线上”,利用人工智能算法和深度学习能力,让听障人群在线上就能做准确的听力验配?带着这个疑问,付聪开始研发适配算法。他将这个过程比喻为做应用题,需要查询国内外文献、检索现有方案,根据具体的使用环境,利用现有知识开展合理想象、设计实验、寻找答案。
这个过程考验人工智能训练师的耐心、细致。在测试助听器音质时,不同的佩戴方式,对应不同的测试结果。付聪和同事需要以“N×N”排列组合设计不同的佩戴方式,并且不断重复试验,来研究其对音质产生的影响。
这个过程十分考验人工智能训练师的忍受力。“一个人工智能训练师的基本素养,就是强迫自己听很多次刺耳的声音。”付聪表示,这是因为训练师需要定量衡量听障患者能正常听到的声音极限点,而这些声音的分贝数是正常人耳难以忍受的,“很多时候恨不得把耳机摔掉。经过一天测试,整个脑袋都感觉疼”。
经过不断迭代、调整,内置了算法的助听器终于完成了。最让付聪难忘的是他们第一次到广东韶关捐赠产品,他们把助听器挨个交到听障老人手上,开机、戴设备、调整增益……“虽然我对模型很有信心,但当时还是感觉心提到了嗓子眼,因为在此之前,老人们是无法正常交流的。”付聪说。
他小心地询问一个老人:“您能听到我在说什么吗?”
“可以了。”老人缓慢而又坚定地从口中说出3个字。
“那时候我觉得,我们做的这个事情挺有意义的。”付聪说。
用技术解决人类需求
人工智能训练师是一个需要忍受孤独的职业,因为他们大量的时间是在设计方案、写代码、采集数据、训练模型中度过的。
“我战胜孤独的秘密是兴趣。”付聪的专业是通信,其中很多课程和信号处理相关,他平时比较喜欢音乐,因此就将自己的兴趣和专业、工作结合起来,聚焦音频领域,大学毕业后参与了很多有关音频信号处理的工作,经历了音频算法从传统算法到人工智能算法,再到大规模深度学习的各个阶段。
在付聪看来,人工智能技术是一个很好的工具,目的是将人类从很多脑力劳动中解放出来,用规模化的方式去替代目前成本较高的个体劳动。对整个社会而言,这是一种生产力的进步,有着巨大的社会价值和商业价值。
成熟的人工智能技术是什么样?付聪认为需要经过3个阶段:一是感知智能,核心在于模拟人的视觉、听觉和触觉等感知能力,比如人脸识别、语音识别等;二是认知智能,具有人类思维理解、知识共享、行动协同或博弈等特征,“能够真正理解人在说什么,根据一些提示,提供相对完整的回答”;三是行为智能,也就是像自动驾驶一样,真正可以在物理世界发挥作用。
达到这样的目标,需要对人工智能模型不断进行训练。付聪表示,首先需要针对问题准备足够多的数据,“多到尽量涵盖解决这个问题时所遇到的所有情形”;其次需要设计很好的算法,并根据用户反馈不断优化。
“人工智能技术领域日新月异,要求人工智能训练师有广阔的视野、深厚的人文情怀和社会责任感,用业界最新想法、理念和正确的伦理观来帮助人类解决生产生活中遇到的问题。”付聪说。
这个职业的出现加速了人工智能技术在行业应用中的发展,具有较高的经济
一*与其羡慕他人智慧,不如自己勤奋补拙;与其羡慕他人优秀,不如自己
同花顺数据中心显示,浦发银行7月28日获融资买入1075 57万元,占当日买
原标题:成都大运会|择日不如撞日,当这名中国选手决定原地求婚…...
2022-03-02:广汽传祺GS4绝对是整个品牌的C位车型。说起来真的就像打开
儿童的奇思妙想到底有多有趣?来市儿童公园看看你就知道了。7月30日上
华声在线7月29日讯(全媒体实习记者蒋诗雨通讯员周闯廖春阳)日前,国家
钟祥:客店首届趣味运动会欢乐又够味---湖北日报客户端讯(通讯员黎阳
英联股份披露半年报。公司2023年上半年实现营业收入892,555,976 84元,
如果在街头做采访,问大家拥有100万元存款,算不算有钱人?相信大多数
香港财政司司长陈茂波近日表示,由于对外出口需求持续疲软,今年以来香
韩国摇滚歌手玛雅,韩国yg公司面试要求这个很多人还不知道,现在让我们
由腾讯视频出品的舞台生存实验节目《舞台2023》,于7月29日迎来首播。
截至7月30日13时奖牌和排名 “中国的饮料行业缺一个兰世立,”7...
冰岛有去吗?怎么去呢?小编来告诉你,这篇攻略里面有关于冰岛的签证和
上一场比赛,商隐踢了85分钟,按照他的表现,其实45分钟就应该被换下,
大象新闻记者梁新慧通讯员武彬田鹏7月28日,国网郑州供电公司按照市委
腰围60到80是1尺8到2尺4。腰围60是小蛮腰。因为腰围60等于1尺8。而小蛮
据央视财经7月29日报道,当地时间7月28日,联合国人道主义事务协调厅就
大运会开幕式上的蜀绣引导牌出自她们之手
各位网友们好,我是编辑小夏,为大家解答李沁真实男朋友是谁,揭秘一下
【大运走笔】作者:陈城7月29日,成都大运会首金落定中国,来自成都体
,你们好,今天0471房产来聊聊一篇目石,目石简述的文章,网友们对这件
从2021年开始到2023年,新能源汽车的发展让我们见识到了从异军突起到左
中国男篮将转战意大利出战特伦蒂诺杯媒体人晒16年时的老照片,周琦,意大
特别是与人争论这件事,毫无意义,也只会为自己培养一个仇人。我们每个
题:黑土地农家书屋飘“书香”:吉林乡村筑起“文化粮仓”中新网...
浙江建有公立中医院98家,“十四五”期间规划改新建60个中医医疗服...
历城二中女足夺得世界中学生足球锦标赛冠军。贺信中国中学生体育代表团
[烟花]小儿健康的话题。小朋友的健康是每一个作为家长最关注的问题