中文字幕另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sub id="3hn2b"><ol id="3hn2b"></ol></sub>

<xmp id="3hn2b"></xmp>

<td id="csi2n"><ol id="csi2n"><b id="csi2n"></b></ol></td>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 蘋果推高精度手寫識別系統(tǒng)，可準確識別3萬字符集

蘋果推高精度手寫識別系統(tǒng)，可準確識別3萬字符集

作者：時間：2017-09-28 來源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　在手機、平板和可穿戴設備不斷普及的今天，手寫識別比以往任何時候都重要。但這并非易事，拿漢字來說，讓移動設備識別大量手寫漢字字符還是個挑戰(zhàn)。

本文引用地址：http://www.antipu.com.cn/article/201709/364988.htm

　　今天，蘋果機器學習博客發(fā)表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》，介紹了蘋果如何在iPhone、iPad和Apple Watch的Scribble模式中解決上述問題。

　　這套基于深度學習的識別系統(tǒng)，能準確處理多達3萬個字符。為了提高準確性，蘋果研究人員還特別注意了數(shù)據(jù)的收集環(huán)境、典型字體和訓練方案。他們發(fā)現(xiàn)，這套系統(tǒng)還能支持更大的字符庫。

　　蘋果研究人員的實驗表明，只要訓練數(shù)據(jù)集的數(shù)量夠大質(zhì)量夠好，準確率只會隨著字符量的增加緩慢下降。量子位將這篇博客中的要點翻譯整理，與大家分享——

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　簡介

　　手寫識別能夠提高用戶在移動設備上的體驗，尤其適用于漢字這種相對復雜文字的使用者。由于漢字數(shù)量和書寫樣式多，手寫識別確實是個大挑戰(zhàn)。

　　字母類的語言也就涉及到100多個字母的排列順序，但在中國國家標準GB 18030-2005《信息技術(shù)中文編碼字符集》中就收錄了27533個字符。

　　日常生活中，人們只用得到最具代表性的一小部分。因此，國標GB2312-80《信息交換用字符編碼字符集·基本集》中僅包含6763個字符。中科院自動化研究所創(chuàng)建的CASIA數(shù)據(jù)庫中所用字符有6763個，其中一級字符(常用字)3755個，二級字符(非常用字)3008個。

　　然而，早期識別算法主要依賴分析筆畫的構(gòu)造。后來，研究人員對研究漢字整體結(jié)構(gòu)的方法產(chǎn)生了興趣。由于眾多漢字具有相似性，漢字識別的難度加大，研究人員通過分類降低錯誤識別。

　　在MNIST數(shù)據(jù)集的拉丁文任務中，卷積神經(jīng)網(wǎng)絡(CNN)嶄露頭角。因為訓練數(shù)據(jù)足夠大，根據(jù)需要補充合成樣例，CNN無疑是最好的方法。美中不足的是，這些研究中分的類別很少。

　　當我們開始研究漢字的大規(guī)模識別時，CNN似乎是個不錯的選擇。但這種方法需要將CNN擴展至約3萬個字符，并且在嵌入設備上實時保持性能。

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　系統(tǒng)結(jié)構(gòu)

　　我們采用的是CNN通用架構(gòu)，類似于之前在MNIST上手寫識別實驗中的架構(gòu)。系統(tǒng)結(jié)構(gòu)如圖所示：

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　△典型的CNN架構(gòu)

　　出于性能原因，我們將輸入設定為一個中等分辨率的圖像(48x48像素)，這是普通手寫漢字的大小。之后我們將它輸入至特征提取層，交替進行卷積和子采樣。最后一個特征提取層通過全連接層輸出。

　　從一個卷積層到下一個卷積層，我們選擇了kernel的大小和特征映射的數(shù)量得出粗粒度特征。通過用2x2 kernel，我們對最大池化層進行了采樣，每個輸出層都有一個節(jié)點。

　　下圖展示了使用CNN的運行結(jié)果，其中“Hz-1”指的是一級字符庫(3755個字符)，“CR(n)”表示輸入法界面排序為n的可能字符的準確度。除了常見的“最可能字”(top-1)和top-10的準確性外，我們也特意提到了top-4的準確性，因為輸入法界面一開始會顯示4個可能漢字，而top-4的準確性是用戶體驗提升的重要指標。

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　△在CASIA在線數(shù)據(jù)庫3755個字符上的運行結(jié)果

　　除此以外，我們對在iOS設備內(nèi)部收集的額外訓練數(shù)據(jù)感興趣。此數(shù)據(jù)涵蓋了更多字體樣式，并包含每個字符大量的訓練實例。在同一個有3775個字符測試集的訓練結(jié)果如下：

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　這次訓練準確度有些許提高，總體來說，在測試集中出現(xiàn)的大多數(shù)漢字書寫風格已經(jīng)在CASIA訓練集中得到了很好覆蓋，也表明折疊訓練數(shù)據(jù)不會使準確性下降，附加樣式在對底層模型沒有負影響。

　　擴展至3萬字

　　我們想為用戶提供從印刷體到草書等各種可能的輸入字體。為了盡可能多涵蓋不同的漢字書寫風格，我們從中國幾個地區(qū)找到了一些書法家的數(shù)據(jù)。讓我們驚訝的是，大多數(shù)用戶表示沒有見過這些罕見的漢字。

　　因此，我們又收集了不同年齡段、性別和不同教育背景的用戶數(shù)據(jù)，發(fā)現(xiàn)了各種各樣的書寫風格。下圖顯示了樣例中“花”字在楷書、草書和“隨便畫幾筆”風格下的樣本。

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　事實上，在日常生活中，用戶輸入經(jīng)常是“隨便畫幾筆”，出現(xiàn)一種非常不相似的曲線變化。有時也會讓系統(tǒng)混淆成其他字符。下圖展示了我們在數(shù)據(jù)中觀察到的一些具體例子。需要注意的是，有足夠的訓練數(shù)據(jù)能區(qū)分像Figure 7這樣的草書變化很重要。

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　用這種方法，我們收集了大量漢字，將可識別字符從3755增加到大約3萬。

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　△30000個字符在CASIA在線數(shù)據(jù)庫的結(jié)果

　　為了解系統(tǒng)如何支持30000個手寫字符識別，我們還在許多不同測試集上對其進行評估，這些測試集支持所有字體的字符。平均測試結(jié)果如下：

　　

蘋果推出高精度手寫識別系統(tǒng)，可準確識別3萬字符集

　　△不同字體的30000個字符在多個內(nèi)部測試集的平均結(jié)果

　　當然，上面兩張圖的結(jié)果不能直接比較，因為它們屬于不同的測試集上。但我們能發(fā)現(xiàn)，top-1和top-4的準確性相當，top-4達到了95.1%的準確率，結(jié)果尚好。

　　綜上所述，我們在嵌入式設備上構(gòu)建了覆蓋3萬個字符的高精度手寫識別系統(tǒng)。只要有足夠數(shù)量和質(zhì)量的訓練數(shù)據(jù)，識別準確度就不會大幅降低。未來，我們能精確識別的漢字字符還會更多。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：蘋果 手寫識別

評論

相關(guān)推薦

蘋果公司CEO喬布斯在斯坦福大學的演講中文字幕

視頻蘋果喬布斯 | 2011-10-12

傳蘋果智能將錯過iOS 18 9月份大升級推遲1個月發(fā)布

手機與無線通信蘋果智能 iOS 18 推遲人工智能 iPhone iPad Apple Intelligence | 2024-07-29

大嘴業(yè)話：“PC化”浪潮正在吞噬手機文化

視頻蘋果 Android 智能手機 | 2012-03-13

蘋果公司2011年部分專利

資源下載蘋果專利 | 2013-09-16

如何高仿蘋果日歷

資源下載如何高仿蘋果日歷 | 2013-09-13

打破索尼壟斷！郭明錤曝iPhone 18要用三星傳感器

手機與無線通信三星影像傳感器蘋果 | 2024-07-25

1 Apple TV 介紹

視頻蘋果 2015新產(chǎn)品 Apple TV | 2015-07-08

Apple（蘋果）機電源電路圖

設計方案 Apple 蘋果電源電路圖 | 2011-08-16

方正電腦將預裝蘋果iTunes數(shù)字音樂點播軟件

pingdea | 2005-11-18

蘋果造車能造出一個新蘋果嗎？

設計方案蘋果無人駕駛汽車電動車 | 2015-09-07

蘋果推出面向Mac和PC用戶的802.11g移動基站

hehehehe | 2005-11-24

蘋果手機電路圖(M42C)

設計方案蘋果手機電路圖 | 2012-07-25

AMOLED面板緣何成移動設備“新寵”？

設計方案 AMOLED 三星蘋果移動設備 | 2015-07-19

蘋果公司手機的ID設計

資源下載蘋果公司手機設計 | 2013-09-13

蘋果電腦展在巴黎舉行

hpnet | 2003-09-23

蘋果混合實境Vision Pro中國退貨率高達50％

消費電子蘋果混合實境 Vision Pro 退貨率 | 2024-07-24

蘋果或?qū)⒂瓉砩墴岢保何磥韮赡陜?nèi)近70%出貨量為新機型

消費電子蘋果 AI Apple Intelligence iPhone iPad | 2024-07-16

蘋果擺脫高通依賴！曝iPhone SE 4首發(fā)蘋果自研5G基帶

手機與無線通信蘋果 5G基帶高通 | 2024-07-25

蘋果iPod Touch和iPhone拆機對比評測

資源下載蘋果 Touch iPhone 拆機對比評測 | 2013-09-16

反壟斷機構(gòu)加強對OpenAI的審查，取消董事會中觀察員席位

OpenAI 微軟蘋果壟斷 | 2024-07-11

大嘴業(yè)話：如何打敗蘋果

視頻蘋果三星安卓谷歌 | 2012-09-21

MOTO 與蘋果合作開發(fā)的新手機

資源下載蘋果新手 | 2013-09-13

美股再新高，蘋果市值超微軟，特斯拉九連漲，期銀一度跌3%，法股高開低走

手機與無線通信蘋果微軟特斯拉 | 2024-07-09

仿Apple（蘋果）機電源CLC-3型電路圖

設計方案 Apple 蘋果電源 CLC-3 電路圖 | 2011-08-16

反壟斷審查愈演愈烈，微軟、蘋果放棄OpenAI董事會席位

智能計算微軟蘋果 OpenAI | 2024-07-11

蘋果規(guī)劃于M5芯片導入臺積電SoIC先進封裝制程

EDA/PCB 蘋果 M5芯片臺積電 SoIC 封裝制程 | 2024-07-15

2 iPhone 的酷炫特性

視頻蘋果 2015新產(chǎn)品 iPhone | 2015-07-08

Mac轉(zhuǎn)基英特爾給蘋果帶來什么好處

taishij | 2005-11-15

臺積電2納米、SoIC 蘋果搶首批訂單

EDA/PCB 臺積電 2納米 SoIC 蘋果 | 2024-07-15

日本蘋果電腦社長：40歲以前跳一次槽

liujt_ic | 2003-05-15

焦點

推薦視頻

技術(shù)專區(qū)