筆趣閣 - 歷史小說 - 黑科技超級輔助在線閱讀 - 第197章語音識別

第197章語音識別

書迷正在閱讀：重生之全能明星學(xué)霸不太易、紅樓之賈赦修仙記、[綜漫]在下才不要穿小洋裙、抗日之超級壯丁、紅樓之貴妃是個小花精、拯救二次元美女、他的陸太太很甜、抗戰(zhàn)雙子星、變身最強(qiáng)之病弱七實、大宋超級學(xué)霸

    智能音箱的硬件和一些生態(tài)內(nèi)容，都已經(jīng)搞定了，就差一個智能的軟件了。

    要說智能音箱，智能才是他的心臟部位。

    但是智能這個詞語，聽起來很簡單，無非就是兩個字，但是做起來卻是“蜀道難，難于上青天。”這種感覺。

    就拿那個喚醒詞來說吧，林奇決定要把那個喚醒詞去掉，可是研究了很久，還沒有研究到去掉喚醒詞的地步。

    因為在第一步的時候就被束縛了手腳，那就是語音識別。

    近些年來人工智能里面的機(jī)器學(xué)習(xí)發(fā)展的很是厲害，尤其是機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)。

    深度學(xué)習(xí)利用的是大于3層的神經(jīng)絡(luò)來學(xué)習(xí)，有輸入層，輸出層，中間還有很多隱藏層。

    只需要把大量的數(shù)據(jù)過來，輸入給寫好的程序，運行一段時間之后，就會計算出來一個模型。

    輸入的數(shù)據(jù)越多，運算的次數(shù)越多，一般情況下得出來的結(jié)果也越好。但是這里面還有一個需要注意的就是不能太依賴于輸入的數(shù)據(jù)了，否則會出現(xiàn)過擬合的現(xiàn)象。

    過擬合就是在給定的數(shù)據(jù)中，讓程序來預(yù)測某些結(jié)果，它能達(dá)到很高的準(zhǔn)確性，比如99999，但是到了通用的數(shù)據(jù)下，這個模型表現(xiàn)的就很差，可能只有的準(zhǔn)確性。

    林奇開始的時候也是利用了深度多層神經(jīng)絡(luò)來進(jìn)行訓(xùn)練語音樣本的，因為現(xiàn)在市面上最流行的就是種方法。

    不過別的公司能采用這種是因為他們有很多的音頻資料，并且都是用戶自己上傳的一些音頻素材，比如深信，月活躍量一度超過10億人，可想而知，每天用它發(fā)語音的有多少人，他能收集到多少的語音片段。

    再比如尋她、搜貓和可大訊飛，他們?nèi)夜径加凶约旱妮斎敕?，每一個人都說自己的語音識別準(zhǔn)確率最高，在手機(jī)上用這三種輸入法的大有人在，當(dāng)然雖然在一些環(huán)境下用語音輸入很是麻煩，但是有一些特定的環(huán)境還是很不錯的。

    所以他們收集到的來自真人的各種場景的語音片段，也是非常豐富的。

    像上面的這些公司他們使用深度神經(jīng)絡(luò)來訓(xùn)練語音模型，沒有任何問題。

    但是第二智慧科技沒有聊天工具，也沒有語音輸入法，林奇也想過去這些公司買一些數(shù)據(jù)，用來訓(xùn)練自己的語音識別庫，但是思來想去，還是落了下乘。

    第二智慧科技要推出的智能音箱，最主要的一個環(huán)節(jié)的原料卻是從別人那里購買的，雖然沒有什么問題，但是林奇總覺得很別扭。

    后來林奇也想過去各大站上面爬一些數(shù)據(jù)，有生物計算機(jī)在后面給自己的大力支撐，爬別人的數(shù)據(jù)，應(yīng)該很方便。

    林奇也真的去這么做了，為了n頻率，還特意的n了一些速度。就這樣爬了一些數(shù)據(jù)，但是這些數(shù)據(jù)拿到手里，林奇發(fā)現(xiàn)有一個問題，那就是這些數(shù)據(jù)很多都是錄音棚，或者加工后的數(shù)據(jù)。

    與用戶實際生活中，比如在地鐵上發(fā)的語音，在公交車上發(fā)語音，或者在大街上發(fā)語音，在家里發(fā)語音都不太一樣，爬出來的數(shù)據(jù)很多都沒有環(huán)境音。

    沒有環(huán)境音本身其實是好的音頻，但是對于做語音識別來說這個就非常不合適了，因為做出來的模型不符合人們正常生活，與實際使用場景不符。

    那就很尷尬了，就好比你說一個人很厲害，可以用劍殺惡龍，在有惡龍的世界里面，他是當(dāng)之無愧的英雄。

    但是如果他來到了現(xiàn)實生活中，就一事無成。

    無他，只是因為現(xiàn)實生活中沒有惡龍來給他殺。一個殺雞的可能都比他在現(xiàn)實生活中，更容易生存下去。

    最后林奇決定還是自己來搞這個模型，不僅僅語音識別是需要大量的數(shù)據(jù)，現(xiàn)在所有的涉及到深度學(xué)習(xí)的都是需要大量的數(shù)據(jù)來進(jìn)行訓(xùn)練。

    林奇并不覺得這是絕對正確，就像我們?nèi)祟愐粯?，比如一個新奇的物種，并沒有見過，然后你給他了一張照片，說這是神獸饕餮，然后等他再次看到的時候，他很容易就能認(rèn)出來，那個是不是神獸饕餮。

    林奇想做的是能通過少量的樣本就能訓(xùn)練出來一個不錯的模型，這樣就可以解放語音的大數(shù)據(jù)。

    同時一個人上手的時間更短，想想即使一個人口音很重，用了智能語音軟件說了幾十句話，或者十幾句話之后，準(zhǔn)確率大大提高，可以堪比用標(biāo)準(zhǔn)的新聞聯(lián)播主持人那樣的普通話說出來的識別率。

    其實在自然語言方面，林奇之前有一些經(jīng)驗，是在創(chuàng)造自然語言編程的時候。

    但是里面設(shè)計到的多是語義的一些解析，沒有涉及到語音識別。

    林奇相信只要自己能通過第一關(guān)卡，那么后面的應(yīng)該都很簡單。

    為了這個目的，林奇瘋狂的投入到了開發(fā)中。

    林奇把每一個的漢字讀音都收集了起來，然后有語料數(shù)據(jù)的時候，林奇把這個語料做了一個分類。

    一個是標(biāo)準(zhǔn)讀音串起來的語音，一個是真實的語音。

    林奇先處理了真實語音，把真實語音分成了環(huán)境音和人聲。

    接著又拿出來人聲和原來的標(biāo)準(zhǔn)讀音進(jìn)行對比，找出來了兩者的差異。

    經(jīng)過不懈的努力，還真的找出來了同一個人在說不同話的時候有一些相同的東西。

    就像不同地方的人有不同地方的口音一樣，一個人說話的時候，與標(biāo)準(zhǔn)的普通話有固定的“偏差”。

    找出來了這個“偏差”，林奇非常興奮，他覺得這個可能是他最近一段時間研究，最大的成果了。

    有那個處于地下四層之下的量子生物計算機(jī)的強(qiáng)大后盾，林奇研究出來了這個“偏差”，又基于這個做出來了一套新的語音模型。

    這種新的模型，與市面上的模型都不一樣，市面上的模型都是一個固定的，比如用戶和b用戶安裝后得到的都是一樣的模型。

    而這個不一樣，開始安裝的時候都是一樣的，但是人們說的話越多，他得到的數(shù)據(jù)越多，就越精確，并且模型會根據(jù)這個人的語音輸入而變化，以至于可以達(dá)到千人千面，甚至億人億面。

    這也是因為第二智慧科技有生物計算機(jī)在后面作保證的，如果沒有這些功能和存儲都很厲害的生物計算機(jī)，這是不可能實現(xiàn)的。

    第二智慧科技也有一支團(tuán)隊在做語音識別，不過他們就是按照常規(guī)的深度學(xué)習(xí)來做的建模。

    最近他們遇到了一個問題，找到了林奇這里。

筆趣閣_書迷正在閱讀：重生之全能明星學(xué)霸不太易、紅樓之賈赦修仙記、[綜漫]在下才不要穿小洋裙、抗日之超級壯丁、紅樓之貴妃是個小花精、拯救二次元美女、他的陸太太很甜、抗戰(zhàn)雙子星、變身最強(qiáng)之病弱七實、大宋超級學(xué)霸

《黑科技超級輔助》情節(jié)跌宕起伏、扣人心弦，是一本情節(jié)與文筆俱佳的歷史小說，筆趣閣轉(zhuǎn)載收集黑科技超級輔助最新章節(jié)。

青草草色a免费观看在线,亚洲精品国产首次亮相,狠狠躁夜夜躁av网站中文字幕,综合激情五月丁香久久

第197章 語音識別

第197章語音識別