人工智能训练师：让机器更“懂”人类（新职·新知③）

本信息由中国舆情网大数据平台根据信源规则识别收录,仅供参考。 时间：2023-07-31

　　打开电脑，将采集的风声、雨声、溪流声等声音数据输入，舆情网，“清洗”掉夹杂其间的噪音，对助听器数据模型进行“训练”，测试模型在真实场景的灵敏度……伴随着手指敲击键盘的“啪嗒啪嗒”声，腾讯天籁实验室人工智能训练师付聪一天的工作就此开始。

　　近几年，随着人工智能技术不断发展，这个被称为人工智能训练师的职业逐渐壮大。作为“数字职业”之一，人工智能训练师的出现，加速了人工智能由技术研发走向行业应用的过程，将产生较高的经济价值和社会价值。

　　为模型不断“喂”数据

　　每次出门时，付聪总会在耳朵上戴一个大“耳环”。

　　这个“耳环”其实是一个测试版的助听器。“耳环”里的声音各式各样，有呼呼的噪声，有尖锐刺耳的吵闹声……这些经过助听器放大后产生的噪声，是很多佩戴助听器的听障人士长期面临的困扰。

　　付聪和他的团队正在尝试利用算法设计、通过人工智能技术“训练”数据模型，让助听器更加“智慧”地降低噪声，让听障人群听得清、听得懂、听得舒服。

　　付聪解释说，助听器数据模型很小，因此需要针对不同场景进行优化，很多场景充满挑战，“比如一个听障人士在餐厅吃饭，周围有很多人说话，他想跟对面的人聊天，四周声音特别嘈杂，作为一个正常人都可能听不清楚，更何况一个有听力障碍的人？我们希望利用模型，把需要的声音提取出来，降低噪声，帮助更多听障人群”。

　　理想很丰满，但是实际的模型算法研发过程却像是一场反复进行的“战役”。

　　模型的研发过程大致分为以下几步：数据采集、数据“清洗”、模型训练、场景测试、调整算法，经过几次迭代之后再测试、调整，“如果测试结果不理想，需要把这个过程再走一遍，直到得到最优效果”。付聪说。

　　数据采集要有针对性。为了让模型更“聪明”，需要针对不同场景采集各种特殊数据。付聪和团队成员不仅需要到早晚高峰的地铁、热