中文字幕另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sub id="3hn2b"><ol id="3hn2b"></ol></sub>

<xmp id="3hn2b"></xmp>

<ruby id="2cght"><s id="2cght"></s></ruby>

<pre id="2cght"></pre><td id="2cght"><s id="2cght"><ul id="2cght"></ul></s></td>

新聞中心

EEPW首頁 > 消費電子 > 設(shè)計應(yīng)用 > AI驅(qū)動的耳機通過語音克隆和3D空間音頻提供群組翻譯

AI驅(qū)動的耳機通過語音克隆和3D空間音頻提供群組翻譯

作者：時間：2025-05-13 來源：Tech Xplore

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

華盛頓大學(xué)（University of Washington）的博士生陳拓超（Tuochao Chen）最近參觀了墨西哥的一家博物館。陳不會說西班牙語，所以他在手機上運行了一個翻譯應(yīng)用程序，并將麥克風(fēng)對準(zhǔn)導(dǎo)游。但即使在博物館相對安靜的地方，周圍的噪音也太大了。由此產(chǎn)生的文本毫無用處。

最近出現(xiàn)了各種技術(shù)，有望實現(xiàn)流暢的翻譯，但這些都沒有解決陳的公共空間問題。例如，Meta 的新眼鏡只能與隔離揚聲器一起使用;他們會在說話人完成后播放自動語音翻譯。

現(xiàn)在，Chen 和威斯康星大學(xué)的一組研究人員設(shè)計了一種耳機系統(tǒng)，可以同時翻譯多個揚聲器，同時保留人們聲音的方向和質(zhì)量。該團(tuán)隊構(gòu)建了這個名為 Spatial Speech Translation 的系統(tǒng)，并使用裝有麥克風(fēng)的現(xiàn)成降噪耳機。該團(tuán)隊的算法將空間中的不同說話者分開，并在他們移動時跟隨他們，翻譯他們的語音，并以 2-4 秒的延遲播放。

華盛頓大學(xué)的研究人員設(shè)計了一種耳機系統(tǒng)，可以同時翻譯幾個人說話，跟隨他們的移動并保留他們聲音的方向和質(zhì)量。該團(tuán)隊構(gòu)建了這個名為 Spatial Speech Translation 的系統(tǒng)，并使用配有麥克風(fēng)的現(xiàn)成降噪耳機。圖片來源：Chen et al./CHI '25
該團(tuán)隊于 4 月 30 日在日本橫濱舉行的 ACM CHI 計算系統(tǒng)中的人為因素會議上展示了他們的研究。概念驗證設(shè)備的代碼可供其他人構(gòu)建?！捌渌g技術(shù)是建立在只有一個人在說話的假設(shè)之上的，”資深作者、華盛頓大學(xué)計算機科學(xué)與工程學(xué)院的教授Shyam Gollakota說?！暗诂F(xiàn)實世界中，你不能只有一個機器人聲音為一個房間里的多人說話。我們第一次保留了每個人的聲音及其來源。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI 耳機 語音克隆 3D空間音頻

評論

相關(guān)推薦

AI拯救電池續(xù)航焦慮！蘋果iOS 19將引入智能省電工具

智能計算 AI 電池續(xù)航蘋果 iOS 19 智能省電工具智能電池 | 2025-05-13

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

OpenAI正與微軟重議合約以保證未來IPO可能性

智能計算 OpenAI 微軟 AI | 2025-05-12

安富利帶OLED顯示屏的頭戴式耳機方案

資源下載 MOD688BGB-OLED 藍(lán)牙耳機 | 2007-10-31

美國AI領(lǐng)先優(yōu)勢并不大四巨頭呼吁國會：放開出口管制和監(jiān)管！

智能計算 OpenAI AI | 2025-05-09

AI驅(qū)動的耳機通過語音克隆和3D空間音頻提供群組翻譯

消費電子 AI 耳機語音克隆 3D空間音頻 | 2025-05-13

藍(lán)牙無線耳機設(shè)計及VxWorks移植方法

資源下載藍(lán)牙耳機 I2S總線 VxWorks | 2007-10-31

Arm平臺成功適配阿里開源模型Qwen3

智能計算阿里巴巴 Arm AI 大語言模型 | 2025-05-12

軟銀將開發(fā)AI數(shù)據(jù)中心用高效能存儲器，聚焦IP授權(quán)業(yè)務(wù)

網(wǎng)絡(luò)與存儲 AI 數(shù)據(jù)中心 | 2025-05-09

LC-KING 耳機放大電路

設(shè)計方案 LC-KING 耳機放大 | 2009-07-06

谷歌宣布啟動“AI 未來基金”，支持初創(chuàng)企業(yè)開發(fā)前沿技術(shù)

智能計算谷歌 AI 未來基金初創(chuàng)企業(yè) | 2025-05-13

請教：耳機放大器選型及應(yīng)用(簡單的）

vivi_akmi | 2005-01-13

用OPA2604等雙運放做的耳機功放電路

設(shè)計方案 OPA2604 雙運放做耳機功放 | 2009-07-06

超級廣場效果的耳機放大器電路

設(shè)計方案超級廣場效果耳機放大器 | 2009-07-06

請教：簡單的耳機放大器選型及應(yīng)用

vivi_akmi | 2005-01-13

聯(lián)發(fā)科將展示AI芯片新品，攜手英偉達(dá)進(jìn)軍Windows-on-Arm生態(tài)

智能計算 AI 聯(lián)發(fā)科云端AI | 2025-05-10

一款性能極佳的JFET-MOSFET耳機功放

設(shè)計方案一款性能極佳 JFET-MOSFET 耳機功放 | 2009-07-06

MP3元件開關(guān)，耳機插座，更多更支持開發(fā)。

更多電子 | 2005-09-08

ECC82電子管OT L耳機放大器

設(shè)計方案 ECC82 電子管耳機放大器 | 2009-07-06

HIFI耳機基礎(chǔ)知識入門

資源下載動圈（Dynamic）靜電（Electrostatic）耳機阻抗 | 2007-05-29

AI搜索新貴Perplexity欲融資5億美元估值飆升至140億

智能計算 AI 搜索新貴 Perplexity 融資人工智能 | 2025-05-13

CSR藍(lán)牙芯片采用DSP技術(shù)提高Jabra耳機性能

pingdea | 2005-10-22

硅谷罕見承認(rèn)：谷歌搜索、iPhone等終將退場

智能計算硅谷谷歌搜索 iPhone AI 聊天機器人 | 2025-05-13

高頻紅外線調(diào)諧立體聲耳機電路

資源下載耳機紅外線調(diào)諧立體聲高頻 | 2008-01-08

意法半導(dǎo)體推節(jié)省空間的立體聲耳機放大器

hpnet | 2003-07-26

焦點

推薦視頻

技術(shù)專區(qū)

<small id="827hq"></small>

<em id="827hq"><s id="827hq"><ul id="827hq"></ul></s></em>