做得比你要好。我聽過,更加流暢,而且已經可以達到用中、英兩種語音。你的產品,優勢在哪裡呢?”
“趙總,這就是我接下來要說的。”李燃嚥了口口水。
“別緊張,時間還很多。”老趙揮手笑笑。
“嗯。”李燃說:“是這樣的,騰飛的識別和朗讀,起步早,投入大,比我的研究要領先。但是在人聲音的模擬上,我可能要超過他們。”
“騰飛也有人聲模擬吧。比如,模仿某個明星的聲音。”趙澤君很清楚的記得後世的導航裡,應用的就是模擬技術,可以選擇郭德綱的聲音,林志林的聲音,聽起來還都挺像那麼回事。
“但是您不覺得,騰飛模擬的聲音,這是形似,而不是神似嘛?”說起專業擅長,李燃好像變了一個人,目光炯炯有神地反問,“是能模擬出明星的聲音,可並沒有神韻,一聽就是機器聲。”
“這倒是。沒有感情起伏和頓挫。”趙澤君點點頭。
“用專業術語說,聲音三個主要特徵,是音調、響度和音色,響度是聲音波形的振動幅度,音調的頻率,也即是經常說的男高音、女中音之類,音色是聲音波的波形,決定了聲音的品質。”
李燃開始侃侃而談:“模擬一個人的聲音,第一步是這三個特徵和本人的特徵極為接近,這一點上,騰飛做得比我要好,但並非不能趕超的。像跑步,他們跑得快些,先跑了半分鐘,我雖然落後,但只要一直跑,也能達到他們的水平……”
老趙點點頭,示意他繼續。
“第一步,三種特徵實現形似,第二步,想要實現神似,就必須捕捉一個人聲音這三者的配合方式,透過計算機表現出來,並且要儲存一個人大量的說話習慣,才能模擬對方真實的說話聲音。”
“你能演示一下嗎?”趙澤君問。
“可以。就用我自己舉例子吧,我在資料庫裡儲存了我個人大概十個小時的講話,講話內容都很隨意,如果不用這個資料庫,電腦模仿我的聲音,大概是這樣的……”
他點開了程式,電腦的讀了一段話,乍一聽和李燃的聲音很接近,但稍稍留心下,就會判斷出這不是李燃。
有形無神,像是李燃很機械的在說話。
“那麼如果用我的聲音資料庫,進行分析後,就是這樣的……”李燃低著頭一邊操作電腦,一邊說。
可說完之後,電腦沒有發出任何聲音。
“怎麼了?”趙澤君一愣,問。
只見李燃抬起頭來,笑呵呵的看著老趙,嘴唇緊閉。
但是他的聲音又一次在房間裡響起:“那麼如果用我的聲音資料庫,進行分析後,就是這樣的……”
“哦!”老趙恍然大悟,剛才李燃低頭時候根本沒說話,他聽到的,只是電腦裡的人工智慧聲音。
“有點意思,你再放一遍,我仔細聽聽。”趙澤君說。
“我放點別的吧,讓它讀一段文章。”李燃這次是自己說的,然後匯入了一段常用的聊天話語,重新啟動了程式。
“阿姨你好,我是李燃,請問李教授在家嗎,是這樣的,我有一個專案……”
趙澤君仔細的聽著,微微點頭。
這次先入為主,知道這是機器聲音,然後專門留心去判別,還是能發覺和李燃本人是有一定差別的。
但如果不留意,或者和李燃不是很熟悉的話,乍一聽,說話的這個人就是李燃。
“如果換成模擬別人呢?”趙澤君問。
“資料庫越龐大詳細,模擬的越是準確。”李燃說:“我試驗過,一般能有對方四五個小時的講話作為資料,差不多就能大致掌握對方的說話習慣,資料越多越詳細,模擬得越逼真。像剛才那段,有我十個小時的講話時間。但是理論上來說,不可能百分之百以假亂真。”
“嗯。”老趙又一次看了看時間,已經過去了35分鐘,“你這個技術的確有意思,但未來怎麼進行商業應用?”
“趙總,我暫時並不準備進行商業化。這項技術尚不成熟,第一步模擬聲音三特徵距離騰飛還有段路要走;第二步,收集資料庫暫時也沒有任何規律可言,只能透過大量的講話,我想把這兩個問題都解決了,技術進一步成熟之後,再商業化應用。”
李燃咧嘴一笑:“不過科研都需要錢,我自己生活也需要錢。”
“目前你找到其他的投資了沒?”趙澤君問。
李燃搖搖頭。
“這樣吧,我在澤聯科專門給你開一個小