多媒體

        初識多媒體
        怎樣與多媒體打交道
        繽紛世界的背后
        來來往往多媒體
        多媒體時代的通行證
        如何把精彩留給自己
        新的世紀從多媒體開始

      移動通信

      計算機網絡

      智能網

      光通信

      微波通信

      衛星通信

      交換網

      接入網

      電信管理網

       

          
        電信博物館 > 多媒體 > 怎樣與多媒體打交道 > 低眉信手續續彈

       


      脫機手寫漢字識別

        一、漢字識別概述

        漢字已有數千年的歷史,也是世界上使用人數最多的文字,對于中華民族燦爛文化的形成和發展有著不可磨滅的貢獻,并將繼續發揮重要的、其它文字形式難以取代的作用。然而,漢字是非字母化、非拼音化的文字,在當今高度信息化的社會里,如何快速高效地將漢字輸入計算機,已成為影響人—機交流信息效率的一個重要瓶頸,也關系到計算機能否真正在我國得到普及應用。

        圍繞這一問題,人們提出了各種解決方案。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。

        自動識別輸入分為語音識別和字符識別兩種。漢字識別是模式識別的一個重要分支,也是文字識別領域最為困難的問題,它涉及模式識別、圖象處理、數字信號處理、自然語言理解、人工智能、模糊數學、信息論、計算機、中文信息處理等學科,是一門綜合性技術,在中文信息處理、辦公室自動化、機器翻譯、人工智能等高技術領域,都有著重要的實用價值和理論意義。

        漢字識別技術可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯機手寫漢字識別和脫機手寫漢字識別。

        從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯機手寫體識別?上驳氖,經過科研人員的努力,我國已有印刷體漢字識別和聯機手寫漢字識別的商品出售,目前已形成百家爭鳴、百花齊放的局面,但是脫機手寫漢字識別還處于實驗室研究階段。在脫機手寫漢字識別領域,非特定人脫機手寫漢字識別又難于特定人手寫漢字識別。

        二、 手寫漢字識別中存在的問題及困難

        手寫漢字識別是一種重要的、適用于把手寫文稿隨時輸入計算機的方法,也是機器字符識別最為困難的一個課題,這些困難和問題表現在:

        1、漢字類別多。僅《康熙字典》中就包含了49000多個漢字,而常用的漢字就有4000多個,因而漢字識別問題屬于大類別(或者稱為超多類)模式識別問題,在模式識別理論和方法研究方面有重大意義。 

        2、漢字字形結構復雜。 漢字集合中相似字較多,有些漢字的差別僅為一點或一個筆畫,由于手寫變形的存在,使得手寫體中相似字的區分比印刷體要困難得多。因不同人書寫風格的差異造成手寫漢字的變形很大,具體表現在以下幾個方面: 

       。1)基本筆畫變化。橫不平,豎不直,直筆變彎,折筆的拐角變成圓弧等。
        (2)筆畫模糊,不規范,該連的不連,不該連的卻相連。
       。3)筆畫與筆畫之間、部件與部件之間的位置發生變化。
       。4)筆畫的傾斜角、筆畫的長短、部件的大小發生變化。
       。5)對于脫機手寫漢字,不同人使用不同的書寫筆可能造成筆畫的粗細變化。

        其中,手寫漢字字形的變化是最難以解決的問題。

        一般認為,聯機手寫漢字識別比脫機手寫漢字識別相對容易些。聯機手寫漢字識別是一種人工實時地把漢字輸入計算機的方法,它利用書寫板把筆畫變為一維電信號,輸入計算機的是以坐標點序列表示的筆尖移動軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數目、筆畫走向、筆順和書寫速度等信息,而脫機手寫漢字識別處理的僅是二維的漢字點陣圖象,是漢字識別領域中最后一個十分困難的問題,目前仍然處于實驗室研究階段。

        由此可見,對非特定人脫機手寫漢字識別而言,如果對手寫漢字的書寫不加任何限制(即為自由手寫體漢字),則識別難度相當大?茖W研究中人們總是遵循從易到難的規律,從簡單的問題入手來尋求突破口。由于自由手寫漢字識別太難,人們提出了手寫印刷體漢字識別,這已成為目前脫機手寫漢字識別的主要研究對象。所謂手寫印刷體是指書寫工整的楷書手寫體,要求書寫者工整書寫,盡量少連筆。

        三、展望

        我們研究非特定人脫機手寫漢字識別的目的就是使識別系統能夠實用化。由清華大學電子工程系圖象教研組 OCR(光學字符識別)實驗室研制的THOCR-97綜合集成漢字識別系統于1997年3月22日通過了由國家教委組織的鑒定并獲得了高度評價,其中的非特定人脫機手寫漢字文本識別子系統,對于書寫較為工整的手寫漢字文本,正確識別率達95.8%,為該子系統走向實用化奠定了良好的基礎?梢詷酚^地預言,在今后的5年內,非特定人脫機手寫印刷體漢字識別文本系統將會有產品走向市場。然而,對于自由手寫體漢字識別而言,任重道遠,仍需要科研人員不懈的努力,但是我們不應該就此悲觀,隨著計算機技術的突飛猛進和人腦功能的進一步揭示,可望在不遠的將來發現人腦的識字機理,建立在此基礎上的手寫漢字識別的理論和方法將會有質的飛躍。

      [上一頁] [下一頁]

       

       
      国产精品偷伦视频观看免费| 国产精品视频全国免费观看 | www.久久精品| 国产精品宾馆在线精品酒店| 99久久精品国产一区二区蜜芽| 久久99精品久久久久久不卡| 美女的扒开尿口让男人桶动态图| 国产成人精品无码一区二区| 青青草原综合久久大伊人精品| 无码精品前田一区二区| 无码国产精品一区二区免费vr| 精品国产欧美另类一区 | 男人j进女人屁网站免费| 国产乱码精品一区二区三区中文| 99久久免费国产精品| 亚洲欧美日韩国产精品一区二区| 国产精品无码无片在线观看| 国产精品自在欧美一区| 美女扒开两腿露出尿口的视频| 国产精品186在线观看在线播放 | 亚洲精品tv久久久久| 孩交VIDEOS精品乱子| 国产精品99久久精品爆乳| 69福利青草视频在线观看| 久久er热视频在这里精品| 亚洲国产精品成人| 国产精品91视频| 国产精品拍天天在线| 国内精品免费网站牛牛| 先锋影音在线视频| 日本午夜vr影院新入口| 国产精品国色综合久久| 精品福利一区二区三区| 无码精品A∨在线观看| 亚洲精品电影网| 中文字幕精品一区二区精品| 精品久久一区二区| 欧美亚洲国产丝袜在线| 国产精品成人免费观看| 久久精品国产亚洲av麻豆色欲 | 粉嫩精品美女国产在线观看|