搜狐科技/崔家乐
“这好像是我出生以来第一次认输和道歉。”
10月17日中午,微软人工智能小冰官方微博发布了一条近千字的道歉信,而对方是二次元圈的VOCALOID和洛天依粉丝和P主们。小冰为何道歉?接下来我们就来聊聊,一个人工智能与一个虚拟歌手的故事。
一触即发的战争
也许还有人对虚拟歌姬不熟悉,但你一定听过曾经火边全国各大中小幼儿园的《甩葱歌》。
歌曲的作者就是一个虚拟歌姬——初音未来。
出道于2009年的初音未来也算虚拟歌姬中资历较老的了。得益于二次元文化的快速蔓延,集日本知名动漫声优藤田咲语音和萌系可爱形象于一体的初音一经推出,便深得一众宅男欢心。
迄今为止,初音未来的粉丝已经遍布全球各地,初在刚刚过去的2017年8月31日,这位在人设上永远16岁的偶像诞生刚好10周年,却依旧热度不减。
而微软小冰则不用多讲,其是微软中国团队在2014年5月29日发布的一款人工智能机器人。而作为微软亚洲互联网工程院的宠儿,小冰目前已经升级到第5代。
小冰会唱歌也不是什么新鲜事,很早之前由歌手朱主爱亲自调教的《好想你》亦是火遍大江南北。
——9月底小冰宣布解锁人工智能歌手深度学习模型,小冰将大规模演唱流行音乐,突破人工调教,冲击传统的虚拟歌手。
但是关于小冰该项功能的宣传文案引发了一些虚拟歌姬爱好者的争议,其认为“传统虚拟歌手的时代已成过去,未来再也不需要漫长的手工调教”“虚拟歌手的调教技巧将不再具有价值,被新的歌曲示唱人角色取代”是在轻视VOCALOID和洛天依粉丝等。微软小冰的挑衅引起了V家和洛天依粉丝和UP主的不满。
为此小冰背后的微软(亚洲)互联网工程院紧急发布声明称,“已对微软小冰组管权限进行调整,以避免继续冲突。微软无意参与虚拟歌姬的竞争”,并称“我们尊重所有人类创造者的经验、心血和情感投入。微软的关注仅限于技术和产品,而不包括作品和作者。”
不过事情越演越烈,此次小冰不得不再次发布公告向V家道歉,并且在微博上公开了人设头像。
战火背后究竟孰好孰坏?
好坏之分似乎永远是个千古难题。
我们先来分析下两者背后的技术:
大部分虚拟歌姬,比如初音未来、洛天依等,由YAMAHA集团发行的歌声合成器技术以及基于此项技术的应用程序VOCALOID制作,其采用的音源库单元拼接的模式,每个字的发音在音源库的按照音高和音长有多个候选,然后找一个最匹配的单元通过数字信号处理的算法调整到需要的音高和音长,然后拼接起来。
简单来讲就是:1、音源库——2、挑选音源——3、调整音高音长——4拼接成歌。
按照上述步骤,一首令人满意歌曲的制作周期一般需要数周或数月。虽然高质量调校对制作者的水平要求较高,但这份心力的投入,本身也是聚拢调教者们的向心力。
相比之下,微软小冰生产歌曲似乎轻松了许多。
从公开资料了解到,微软小冰团队持续采集音源并建立了一个庞大的音乐库和声学参数模型,通过深入学习模型,并嵌入一部分说话数据参与训练,同时预测声谱并使其与制定的节奏、音高相匹配,这样微软小冰就可以根据输入的旋律判断其风格并自动调整输出的声谱,使之更加一致。根据目前公布的结果来看,使用者只需要清唱一遍小冰便可学会,速度可想而知。
综合来看,两者的质量似乎无法权衡比较,但是至少在速度上,却是马车与火车的较量。
超越可能是必然,但虚拟歌姬的继续存在也是必然
借用微软的声明,虚拟歌姬好比在一条跑道上一边虽然跑在前面,但速度越来越慢,且趋势不可逆。而微软小冰则正在不断加速,在歌声自然度上超越仅用了不到三个月时间,全面超越只是时间问题,并不存在悬念。
然而虚拟歌姬仍然会存在,甚至是依旧流行。
一方面,我们不能把虚拟歌姬简单地归为一种软件或者是技术,就像不能把书籍当作一种承载信息的媒介一样。
VOCALOID可的背后是发展了整整十年的一个庞大的创作圈,其背后存在着成千上万的内容生产者,以及上亿的粉丝,他们不断的创造出优秀的内容,并不断的吸引新鲜血液加入他们,形成一个自给自足的良性循环。
同时,借助强IP及粉丝的力量,虚拟偶像更是已经走出一条商业模式。以初音未来为例,初音早已成为各大厂商的“宠儿”,代言、授权产品种类从互联网、时装、汽车、手机、到生活用品,世界各地都有其踪迹。
而另一方面,对于微软小冰而言,但终有一天小冰现在使用的技术也会到达瓶颈,作品质量也会付出巨大却难以明显提高,这是历史发展的必然规律。
最后
抛开繁复的技术优劣之争,对于我们来说好听才是硬道理,附上洛天依和微软小冰各自的代表作:《野子》演唱者-洛天依,《我是小冰》演唱者-微软小冰,我们用自己的耳朵感受评判一下吧。
《野子》——洛天依
《我是小冰》——微软小冰