第108頁(1 / 2)

聽起來, 還是有希望的。

除了匹配的問題之外, 另一個最大的問題是語音輸入。

漢字那麼多個, 上哪兒找這麼多人讀。

安夏的想法是去有播音主持相關專業的學校, 把常用字讓學生們各自讀了,到時候湊在一起,數據就夠了。

技術總監張喬生一擺手:「不用這麼麻煩, 可以用PSOLA算法,進行波形編碼合成。」

「早就有了, 不過最近有了新的進展, 出了一種新的動態規劃法, 對濁音段進行整體處理, 時域基音可以同步疊加……」

張喬生興沖沖地企圖教會安夏。

沒等他說完,安夏點點頭:「總之,就是不用人錄,就能出聲音對吧?」

「對。」

「好,你去做吧。」

請程式設計師不要難為產品經理,我只想知道這個功能能不能實現,不是很在意怎麼實現的。

張喬生說到做到,在沒有跳槽進紫金的時候,他就是做音頻相關的,研究的比別人也深一些。

很快就拿出了程序,做第一次測試,安夏輸入「紫金電腦」。

沒聲音。

安夏調整音量,沒動靜。

「音效卡壞了?」安夏問道。

又過了30秒,音箱裡慢悠悠地吐出一個字「紫」。

又過了十幾秒,又緩緩吐出一個「金」。

且不說那個比SIRI還要詭異的語氣。

最要緊的問題是,讀完四個字,用了一分多鐘。

安夏:「能不能在調取數據的時候,讓它稍微快一點?一份合同上千個字,等念完,一天都過去了。兩千字不要超過三十分鐘。」

SIRI風格的念書差不多兩千字十二分鐘,安夏放寬到三十分鐘,已經很放寬了。

程式設計師再對匹配邏輯進行調整,跳過先匹配字符,再匹配聲音的過程,直接匹配聲音。

兩千字,從九點上班開始念,念到下午兩點。

用時比第一版省了一半,然而,離安夏的要求還是很遠。

「現在最大的問題是硬體,算完,再調取音頻,播放,差不多就是這個速度。」

安夏想了想,問道:「如果是固定的詞組或是句子呢?」

「提前錄製好,會快很多。」

大多數商業合同是制式合同,會變動的往往是數字。

最多加一兩條特殊約定。

安夏拿公司的制式勞動合同先存進系統,試了一下,只修改了人名、入職時間、收入等等。

從硬碟調取的速度果然快了許多。

最新小说: [足球]内斯塔与美食家 帝高beta特招生(abo nph) 末世大佬被流放后,她登基做女帝 [排球少年同人] 9.15m 神待少年 [足球] 小国巨星 [??] ???? 荒岛病毒 [足球] 宝宝,你是一只小羊 汉王宝藏
本站公告:点击获取最新地址