分享按钮
声音识别仍然是人工智能中一个相对未被探索的领域,从记录噪音到分析噪音,存在多项技术挑战。然而,该领域的研究正在取得巨大进步,这一切都要归功于公众的投入。
“团队从零开始,创建了一个可以记录和分析声音同时满足隐私要求的系统。”
人工智能和文本识别的历史可以追溯到很多年前
但声音识别是一项更近期的研究,作为一个研究领域,它仍处于起步阶段。声音的微妙之处 尼泊尔数字 是机器在同化方面面临的一大挑战,理解这些微妙之处可能非常困难。第一个障碍是录制音频并建立数据库,以便训练算法。
寻找“金耳朵”
2016 年,Orange 启动了一项名为“物联网金耳朵”的研究项目,旨在设计一种非语音声音识别系统。该系统最终将能够记录、识别和分析声音,并根据使用环境启动不同的动作。也就是说,它可以用于家庭用途(例如,有助于居家养老的活动识别)或工业用途(用于检测工业机器人的故障)。服务设计师 Nicolas Pellen 和 Orange 研究项目经理 Katell Péron 解析了该项目的关键:“该项目的关 直接从美国顶级应用增长专家那里 在于使用和驱动基于神经网络的机器学习算法,并借助尽可能多的数据。获取这些数据需要耗费大量时间和金钱,因此我们想出了推出一款消费者应用的想法,将其变成一款游戏,加快声音的录制和分类。借助Soundary声音拼图应用,用户可以用一到三个声音作为线索来猜测神秘单词,或者根据自己录制的或从声音库中获取的声音来创建自己的神秘单词。很快,还会有“战斗”模式,用户必须在规定时间内解决尽可 香港领先 能多的谜题。作为这些游戏的一部分,用户可以通过给声音贴上标签来标记声音。因此,我们将为每个声音获得多个标签,然后将其用于上下文混合。这将帮助我们识别声学歧义(或同音异义词)并微调系统:人 X 可能会识别并标记声音,而人Y 认为这是一种不同的声音并因此将其标记为不同的声音。”
多年来,游戏化一直被实验室
研究所和大学用作数据分类方法(包括 NASA 用于国际空间站图像的方法),但对于 Orange 的研究,尤其是对于声音识别项目而言,这是一个新流程。在这个阶段,我们理想情况下希望至少有三个人标记相同的声音。
这种参与式研究方法支持了我们之前改进系统设计的努力。项目刚启动时,多学科团队(包括机器学习和声学领域的研究人员以及移动开发人员)依靠公共数据库来启动算法训练。