多媒體

        初識多媒體
        怎樣與多媒體打交道
        繽紛世界的背后
        來來往往多媒體
        多媒體時代的通行證
        如何把精彩留給自己
        新的世紀從多媒體開始

      移動通信

      計算機網絡

      智能網

      光通信

      微波通信

      衛星通信

      交換網

      接入網

      電信管理網

       

          
        電信博物館 > 多媒體 > 怎樣與多媒體打交道 > 低眉信手續續彈

       


      脫機手寫漢字識別

        一、漢字識別概述

        漢字已有數千年的歷史,也是世界上使用人數最多的文字,對于中華民族燦爛文化的形成和發展有著不可磨滅的貢獻,并將繼續發揮重要的、其它文字形式難以取代的作用。然而,漢字是非字母化、非拼音化的文字,在當今高度信息化的社會里,如何快速高效地將漢字輸入計算機,已成為影響人—機交流信息效率的一個重要瓶頸,也關系到計算機能否真正在我國得到普及應用。

        圍繞這一問題,人們提出了各種解決方案。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。

        自動識別輸入分為語音識別和字符識別兩種。漢字識別是模式識別的一個重要分支,也是文字識別領域最為困難的問題,它涉及模式識別、圖象處理、數字信號處理、自然語言理解、人工智能、模糊數學、信息論、計算機、中文信息處理等學科,是一門綜合性技術,在中文信息處理、辦公室自動化、機器翻譯、人工智能等高技術領域,都有著重要的實用價值和理論意義。

        漢字識別技術可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯機手寫漢字識別和脫機手寫漢字識別。

        從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯機手寫體識別?上驳氖,經過科研人員的努力,我國已有印刷體漢字識別和聯機手寫漢字識別的商品出售,目前已形成百家爭鳴、百花齊放的局面,但是脫機手寫漢字識別還處于實驗室研究階段。在脫機手寫漢字識別領域,非特定人脫機手寫漢字識別又難于特定人手寫漢字識別。

        二、 手寫漢字識別中存在的問題及困難

        手寫漢字識別是一種重要的、適用于把手寫文稿隨時輸入計算機的方法,也是機器字符識別最為困難的一個課題,這些困難和問題表現在:

        1、漢字類別多。僅《康熙字典》中就包含了49000多個漢字,而常用的漢字就有4000多個,因而漢字識別問題屬于大類別(或者稱為超多類)模式識別問題,在模式識別理論和方法研究方面有重大意義。 

        2、漢字字形結構復雜。 漢字集合中相似字較多,有些漢字的差別僅為一點或一個筆畫,由于手寫變形的存在,使得手寫體中相似字的區分比印刷體要困難得多。因不同人書寫風格的差異造成手寫漢字的變形很大,具體表現在以下幾個方面: 

       。1)基本筆畫變化。橫不平,豎不直,直筆變彎,折筆的拐角變成圓弧等。
        (2)筆畫模糊,不規范,該連的不連,不該連的卻相連。
       。3)筆畫與筆畫之間、部件與部件之間的位置發生變化。
       。4)筆畫的傾斜角、筆畫的長短、部件的大小發生變化。
       。5)對于脫機手寫漢字,不同人使用不同的書寫筆可能造成筆畫的粗細變化。

        其中,手寫漢字字形的變化是最難以解決的問題。

        一般認為,聯機手寫漢字識別比脫機手寫漢字識別相對容易些。聯機手寫漢字識別是一種人工實時地把漢字輸入計算機的方法,它利用書寫板把筆畫變為一維電信號,輸入計算機的是以坐標點序列表示的筆尖移動軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數目、筆畫走向、筆順和書寫速度等信息,而脫機手寫漢字識別處理的僅是二維的漢字點陣圖象,是漢字識別領域中最后一個十分困難的問題,目前仍然處于實驗室研究階段。

        由此可見,對非特定人脫機手寫漢字識別而言,如果對手寫漢字的書寫不加任何限制(即為自由手寫體漢字),則識別難度相當大?茖W研究中人們總是遵循從易到難的規律,從簡單的問題入手來尋求突破口。由于自由手寫漢字識別太難,人們提出了手寫印刷體漢字識別,這已成為目前脫機手寫漢字識別的主要研究對象。所謂手寫印刷體是指書寫工整的楷書手寫體,要求書寫者工整書寫,盡量少連筆。

        三、展望

        我們研究非特定人脫機手寫漢字識別的目的就是使識別系統能夠實用化。由清華大學電子工程系圖象教研組 OCR(光學字符識別)實驗室研制的THOCR-97綜合集成漢字識別系統于1997年3月22日通過了由國家教委組織的鑒定并獲得了高度評價,其中的非特定人脫機手寫漢字文本識別子系統,對于書寫較為工整的手寫漢字文本,正確識別率達95.8%,為該子系統走向實用化奠定了良好的基礎?梢詷酚^地預言,在今后的5年內,非特定人脫機手寫印刷體漢字識別文本系統將會有產品走向市場。然而,對于自由手寫體漢字識別而言,任重道遠,仍需要科研人員不懈的努力,但是我們不應該就此悲觀,隨著計算機技術的突飛猛進和人腦功能的進一步揭示,可望在不遠的將來發現人腦的識字機理,建立在此基礎上的手寫漢字識別的理論和方法將會有質的飛躍。

      [上一頁] [下一頁]

       

       
      亚洲AV成人精品一区二区三区 | 久久精品无码免费不卡| 久久精品男人影院| 亚洲网红主播剧场| 久久久久无码精品国产不卡| 国产精品美女久久久久网| 国产精品色视频ⅹxxx| 久久99国产精品久久99果冻传媒| 国产精品电影在线| 日本高清在线不卡码ⅴ| 99国产欧美精品久久久蜜芽| 国产精品VIDEOSSEX久久发布| 日本精品一区二区三区在线视频 | 99久久99这里只有免费费精品| 99久久国产综合精品五月天喷水| 亚洲国产91精品无码专区 | 欧美一线高本道高清免费| 精品国产乱码久久久久久郑州公司| 91精品国产91久久久久久蜜臀| 正在播放国产精品每日更新| 成人国内精品久久久久一区| 国产精品无码素人福利不卡| 操女人视频国产年夜| 久久伊人精品青青草原高清| 亚洲国产精品嫩草影院久久| 99久久人妻无码精品系列蜜桃| 久久久久久一区国产精品| 久久精品欧美日韩精品| 久久久久99精品成人片直播| 91久久精品国产成人久久| 美女扒开尿口给男人桶视频免费| 欧美亚洲国产精品第一页| 色偷偷人人澡久久天天| 久久亚洲精品视频| 真实国产乱子伦精品视频| 国产成人精品cao在线| 日韩精品一区二区亚洲AV观看| 国产欧美精品专区一区二区| 久久国产精品成人片免费| 久久久亚洲精品蜜桃臀| 国产91精品一区二区麻豆网站 |