对于大家都想知道的科技公司猿辅导推迟在线教育和一些关于猿辅导有成人辅导吗相关题,那接下来让小编带大家揭晓一下案吧!
杨静于阳发表者奥飞斯量子比特报告|公众号QbitAI
最近我听到很多音频界的朋友谈论。
微样本怎么样,入侵怎么样,训练怎么样……
啊,‘教育’到底是什么?
仔细一打听,才知道是刚刚结束的M2VoCTTS大赛。
M2VoC又称多说话人多风格语音克隆大赛,提供极少量的语音样本,可以合成相同风格的声音。
这不就是一场常规的技术选手比赛吗?
朋友们说,这次看到“外星人”——成为分道冠军,他们感到很惊讶。
猿辅导实行实时在线课程。
在线培训能否打造AI冠军?
据说获胜队当时还有其他紧急工作要做,所以在5天内随机抽取了两人参加。
凡尔赛的怀疑有证据了!
但桥豆麻袋和猿辅导绝对是在线教育公司吧?
M2VoC首战告捷
首先,我们来看看本身。
猿辅导参加的比赛是声学、语音与信号处理会议信号处理挑战中的Task——多说话者多风格语音再现比赛。
ICASSP是由IEEE信号处理学会主办的年度会议,是信号处理和应用领域最负盛名的学会之一。
据说这是世界上第一个小规模声音复制挑战赛。
比赛分为两个赛道,一个是小样本,另一个是比“小样本”赛道样本少的赛道。
在少数样本轨道中,参与者必须对各种说话风格和五种可用音色的样本进行校验和测试。
每条赛道分为公共赛道和私人赛道。开集意味着使用所有公开数据,而闭集意味着仅使用数据。
最终,有150多支队伍参赛,猿辅导在极小样本公开赛赛道上获得了第一名。
它还在小样本开放集和小样本封闭集赛道上分别获得了第四名和第五名。
事实上,Wonbudo在本次比赛中展示的并不是实验室技术。
该技术已经在小圆口算、猿辅导在线课程等产品中得到应用,同时也应用于英语发音、题干阅读等场景。
例如,在阅读一道数学题时,有些幼儿可能不认识所有的字母,需要读给他们听才能理解,老师可以根据题目的文字来设置题,甚至合成音频。
特别是对于英语听力应用,发音要求更加严格。
然而,一线教师表示,他们发现这比公共服务更有用。
过去,老师会提出题,然后找一位普通的英语或美国老师来记录。外包商通常需要一周左右的时间才能返回语音包。
任何修改都可能需要至少2周的时间,在假期期间更难以控制。
现在,通过语音合成,10秒的句子可以在1秒内转换为语音,大大提高了效率。
因此,毫不夸张地说,两人备战比赛只用了短短5天的时间。
让他们没想到的是,他们在第一次比赛中就获得了子赛道的第一名。
他们对结果感到有点惊讶。
我对在副赛道上获得第一名感到有点惊讶。技术领域大咖云集,我们将继续努力!
其基本思想与一般的学习过程相同,都是由大样本的预训练和小样本的微调学习组成。
至于为何获,团队内部分析认为,除了更好的训练数据选择之外,语音合成前端采用的停顿和节奏模型使得合成的语音效果更加自然。
一般来说,最常见的语音合成技术关注的是合成词的准确性。其他诸如正确发音、节奏感、适当停顿等题通常不会被考虑。
就是一本没有感情的书~
然而在教育领域,这些平时容易被忽视的题却成为了技术团队关注的焦点。
不仅要在面对多音字等情况时保证发音正确,而且在幼儿教育场景中也需要让拼写更加自然、有节奏、不那么刺耳。
不要因为你的冷漠而耽误孩子的学习!
这也是猿辅导得到主办方和评委认可的原因。
在猿辅导科技工作怎么样?
那么猿辅导作为一家在线教育公司为何会出现在语音合成技术的舞台上呢?
其实这也是机缘巧合造成的。
当时,该队的杨明基将自己听到的比赛信息转达给了声乐队。当研发同学们谈论着自己的日常活动时,他们突然想到猿辅导在这方面已经积累了技术。那么为什么不利用这次比赛与其他团队讨论和交流想法,看看其他人有什么想法呢?你也在做同样的事情吗?
这种保持对技术前沿的兴趣和主动学习的任务并不是一次性的努力,而是整个技术部门的常态。
这也可以从长期的习惯中看出——
论文阅读是猿辅导AILab自2014年成立以来一直持续的一项活动。
过去七年来,团队会指派技术同学在每周的小组会议上分享前沿技术论文并与其他同事进行深入讨论。
最初,整个实验室都参加了这些阅读活动。后来随着规模不断扩大,改为5个实验室,分开进行,当然自己实验室的学生必须参加,其他实验室的人也可以根据自己感兴趣的领域参加。
不同技术之间的冲突也成为猿辅导独特的技术方法论。
语音实验室语音合成组的杨明琪分享了她的经验。
在听说降噪团队正在分享最新的提高信噪比的技术后,语音合成团队想知道这项技术是否可以应用于TTS。正常采集的训练样本由于录音环境不同,音质无法得到保证,但通过引入相关技术,可以在数据层面提升最终合成语音的质量。
另外,猿辅导作为一家在线教育公司,拥有更丰富、更具体的实施场景,比普通科技公司更注重技术落地。
低延迟直播就是这样的例子之一。
市场上常见的直播技术可能会有1~3秒甚至更长的延迟,这对商品直播场景影响不大。然而,在教育教学中,学生和教师有强烈的互动需求。延迟几秒钟就会影响您的训练体验。
例如,当老师在课堂上一个题时,当学生思考时,老师已经回了这个题,然后下一个题。
因此,要保持课堂效果,延迟技巧必须从3秒减少到03秒。
声优团队马楠也发言。
一线教师经常提出需求,研发人员必须想办法结合最先进的技术来满足这些需求。
所以,通常当我看到一些新的论文和技术方案时,我也会思考它们可能属于哪些具体场景,是否可以与教育一线教师合作。
我们始终保持准备,因为我们重视实施的本质。
随着新需求的出现,我们找到利用技术来满足这些需求的方法,因此,我们的团队成员已经具备了快速适应业务变化的能力。
马楠表示,大部分语音合成团队本来就不是这个领域的专业人士。例如,有些成员曾经搜索过,但我们可以说我们都是通过尝试和错误来学习的。
现在从想法到demo只需要半个月到一个月的时间。
因此,它与其他技术团队的成就感不同,成就感的来源更接近一线老师的反馈。
“比公共服务更有用”是他们获得的最高项。
教育背后的科技
事实上,外界对文福道的认知更侧重于“教育”,但文福道从创立之初就一直是一家将“技术”视为核心竞争力的公司。
2014年,猿辅导成立AI实验室,成为在线教育行业首个AI实验室。
从业务角度来看,猿辅导旗下子公司包括一键即时出解题思路的小缘搜题、利用AI帮助老师和家长批改作业的小缘口算、以及斑马AI课堂。使用人工智能创建智能学习模型.
所需的技术支持不仅限于语音,还包括视觉、自然语言理解、音视频等领域。
我们以斑马AI课程为例。
斑马AI课堂是目前国内最大的学前儿童在线课程学习,其最大的特点就是可以因材施教。
换句话说,不是简单粗暴地按照孩子的年龄来划分学习阶段,而是让孩子自适应地学习。
等等,自适应,这不是训练人工智能模型的方式吗?
这确实发生了,通过基于Wonbudo数十亿儿童语言行为大数据分析儿童语言行为,可以更详细地了解孩子当前的学习情况,智能调整课程难度。“杀怪”之道。完成在线课程后,您可以基于AI大数据分析生成个性化学习报告,并及时反馈学习结果。
此外,如前所述,通用模型在更垂直的场景中实施时通常表现不令人满意。例如,儿童牙牙学语的发音比传统的成人语音识别难度更大,因此需要有针对性的数据收集和模型优化。
在此背景下,猿辅导发展成为五个主要实验室语音实验室、视觉实验室、自然语言理解实验室、音视频实验室、基础支撑实验室。
作为技术人员,马楠还强调
对于我们的产品来说,对尖端技术的支持不是一种选择,而是我们的产品得以建立的关键原因。
以搜索题为例,如果OCR的准确率不够高,搜索不准确,用户根本不会使用OCR。
从目前用户选择来看,猿辅导已成为国内在线课程用户数量最多的在线教育公司。
在技术验证方面,猿辅导已经赢得了MSMARCO机器阅读测试和斯坦福数据集两项世界级NLP比赛的冠军,并且正在更多领域出现在包括口语在内的世界比赛中。……
资本的商业和技术意识也下降到一定数量。该公司估值155亿美元,是全最具价值的在线教育独角兽。
在快速发展的过程中,规模不断扩大的元符岛在注重落实的同时,也越来越注重“长远主义”。
马楠表示,目前技术团队中有相当一部分人员致力于前沿技术的探索和研究。虽然这类研发工作短期内不会立即发挥作用,但公司相信,从长远发展来看,这些积累将成为猿发道技术护城河的关键组成部分。
最后总结一下,猿辅导是一家什么样的科技公司?
以在线教育之名,人工智能技术的力量体现在各种产品中,从每个具体场景入手。
如果一项技术非常发达却没有被使用,那么在元符道就没有使用的可能。
所以,猿发道的AI可以说是比较实用的。
曾几何时,中国的教育行业被认为有一定的模式。然而,以原辅道为代表的第三代教育科技公司却以黑马的身份出现在历史舞台上,开启了新的进攻之路。
其背后的关键关键词是技术和人工智能。
人工智能等下一代技术驱动的教育潜力可能才刚刚开始。
-多于-
量子位QbitAI合同签订
关注我们,第一时间了解前沿技术动态
No Comment