人妻少妇乱子伦精品_日韩人妻潮喷视频网站_日本最新最全无码不卡免费_日韩AV无码中文

當(dāng)前位置: 首頁(yè) > 科技新聞 >

亞馬遜研究新的文字識(shí)別技術(shù),沒(méi)想到先干掉了

時(shí)間:2019-12-31 15:15來(lái)源:網(wǎng)絡(luò)整理 瀏覽:
新酷產(chǎn)品第一時(shí)間免費(fèi)試玩,還有眾多優(yōu)質(zhì)達(dá)人分享獨(dú)到生活經(jīng)驗(yàn),快來(lái)眾測(cè),體驗(yàn)各領(lǐng)域最前沿、最有趣、最好玩的產(chǎn)品吧~!下載客戶端還能獲得專享福

新酷產(chǎn)品第一時(shí)間免費(fèi)試玩,還有眾多優(yōu)質(zhì)達(dá)人分享獨(dú)到生活經(jīng)驗(yàn),快來(lái)眾測(cè),體驗(yàn)各領(lǐng)域最前沿、最有趣、最好玩的產(chǎn)品吧~!下載客戶端還能獲得專享福利哦!


不管你有沒(méi)有聽過(guò),OCR 技術(shù)已經(jīng)滲入到我們生活中的方方面面。

不妨回想一下,汽車出入停車場(chǎng)時(shí)的車牌識(shí)別、金融業(yè)務(wù)開戶時(shí)的銀行卡識(shí)別、身份證識(shí)別、甚至是很多商務(wù)應(yīng)用中的名片識(shí)別等,其實(shí)都是基于 OCR 技術(shù)的。

OCR 的發(fā)展可以追溯到 70 年代初,在數(shù)十年的發(fā)展中,OCR 的識(shí)別速度和識(shí)別成功率在不斷地提高,應(yīng)用場(chǎng)景也在不斷地拓展。

從復(fù)雜背景中提取出文字、多種混合字體識(shí)別、低分辨率圖像中識(shí)別、多語(yǔ)言混合是被、錯(cuò)行識(shí)別甚至是復(fù)雜多行板式識(shí)別等對(duì)于現(xiàn)今的 OCR 技術(shù)來(lái)說(shuō)其實(shí)都已經(jīng)不算什么問(wèn)題。

但發(fā)展到現(xiàn)在,對(duì)于 OCR 技術(shù)來(lái)說(shuō)依舊有一個(gè)瓶頸沒(méi)有突破,那就是彎曲文字。

什么是彎曲文字?

像這樣,

這樣,

還有這樣的。

實(shí)際上,Captcha reCAPTCHA,也就是你登錄網(wǎng)站常常輸入錯(cuò)的歪歪扭扭的文字驗(yàn)證碼,也是基于 OCR 的這個(gè)弱點(diǎn),來(lái)防止被攻擊的。

過(guò)去的 OCR 大多是解決水平文字的檢測(cè)或者傾斜文字的檢測(cè),但其實(shí)像上圖的彎曲在生活中十分常見。

近日,亞馬遜的研究人員就開發(fā)出了一項(xiàng)名為‘TextTubes’來(lái) OCR 識(shí)別算法來(lái)解決這個(gè)問(wèn)題。

簡(jiǎn)單來(lái)說(shuō),該算法首先會(huì)對(duì)目標(biāo)圖像進(jìn)行建模,建立一個(gè)曲線函數(shù),然后再分析出出半徑以及中間軸,繼而生成一個(gè)文本選取分區(qū)。

效果怎么樣?

論文展示了三種不同 OCR 技術(shù)針對(duì)同一個(gè)含有彎曲字體的廣告牌的識(shí)別效果。

結(jié)果顯示,(b)和(c)會(huì)出現(xiàn)識(shí)別框重復(fù)的現(xiàn)象,(b)當(dāng)中還出現(xiàn)了彎曲識(shí)別框未能完全覆蓋文字的情況。

這樣會(huì)帶來(lái)什么結(jié)果呢,一就是會(huì)出現(xiàn)導(dǎo)出的文字結(jié)果會(huì)有重復(fù),而二就是會(huì)導(dǎo)致識(shí)別結(jié)果錯(cuò)誤。

至于 TextTubes 所識(shí)別出來(lái)的效果則很完美地對(duì)廣告牌上的每一個(gè)文字區(qū)域進(jìn)行分區(qū),既不會(huì)出現(xiàn)重疊區(qū)域,而每一個(gè)分區(qū)也都很好地覆蓋所有文字。

為了更好地測(cè)試 TextTubes 的性能,亞馬遜在 CTW- 1500 以及Total-Text 兩個(gè)訓(xùn)練系統(tǒng)上進(jìn)行評(píng)估。當(dāng)中CTW- 1500 含有 1500 張圖像、超過(guò) 10000 個(gè)文本實(shí)體,每張圖像至少還有一個(gè)彎曲文本,而Total-Text 則共有 1255 個(gè)訓(xùn)練圖像、300 個(gè)測(cè)試圖像,每張圖片也是含有一個(gè)或多個(gè)彎曲文本。

那么成績(jī)?nèi)绾??TextTubes 在兩個(gè)測(cè)試中都獲得了優(yōu)秀的成績(jī),在 CTW- 1500 則更為突出,準(zhǔn)確率為 83.65%,相比之下,排第二名的那位學(xué)生,準(zhǔn)確率只有 75.6%。

亞馬遜表示,當(dāng) TextTubes 正式投入使用之后,對(duì)于那些高度依賴 OCR 技術(shù)展開業(yè)務(wù)的企業(yè)來(lái)說(shuō),是一個(gè)福音。根據(jù) Grand View Research 的數(shù)據(jù),市場(chǎng)對(duì)于 OCR 的需求仍在不斷增大,預(yù)計(jì)到 2025 年 OCR 解決方案市場(chǎng)規(guī)模將達(dá)到 133.8 億美元。

等等,不是說(shuō)文字驗(yàn)證碼是基于 OCR 的這個(gè)弱點(diǎn)的嗎?如果突破了,驗(yàn)證碼還安全嗎?

這不所以推出了從一堆劉翔中找出王自如的驗(yàn)證碼嗎?

推薦內(nèi)容