第101部分(第3/4 页)
,咱们的条件毕竟有限,尽力而为吧。不过我估计,现在的国内形势应该还是技术居于首位,研发出产品后,市场应该相对容易开拓些。”
吴云飞的学历在那里摆着呢,因此对眼前的计算机并不太陌生,他坐到那台赵顺华送过来的电脑前,轻轻地摆弄起来。
接下来钱长友粗略地说了一下他在汉卡方面的打算,吴云飞倾听之余,对现在的技术力量提出了担忧。钱长友笑了一下,便将这个话题带过。
很多情况下,那些让人望而止步的困难直到被克服以后,才能显示出领导者的与众不同来。
狼吞虎咽地吃完午饭,钱长友抓起电话就给范世豪打了过去,“大哥,兄弟有事儿找你帮忙。”
对于钱长友的开门见山,范世豪报以呵呵大笑,“长友,就算你不找我,我还要给你打电话呢。说吧,什么事儿?”
钱长友便把打算调查一下现今国内计算机市场情况的想法说了一下,然后请范世豪给予便利和支持。
范世豪沉吟了一下,“你小子太能折腾了,贸易这边还没上正轨呢,又把手伸向了电脑。这样吧。我还有别的事情要找你商量,一会儿就到你那里去详谈。”
钱长友扫了一眼笔记本电脑屏幕上的程序代码,心中虽然惦记着工作进度,但还是毫不犹豫地答应了下来。
目前汉卡的开发进度刚刚开始,还处于字库的建立阶段。钱长友编了一个小程序,打算专门用于读取已有汉卡当中地信息,然后进行分析,把字库数据提取出来,优化一下,转为己用。可以说是走一条捷径吧。
不过这也谈不上侵犯知识产权,技术领域内,很多事情都是非常边缘化和模糊化的。记得前世里,搜索业的巨无霸Google研发的中文输入法,就曾经被人指控剽窃了搜狗拼音输入法的词库,此事在互联网上闹得沸沸扬扬,最终Google灰头土脸地删掉了程序的相关部件。
现在自己的目的只是借鉴,并非照搬过来,原封不动地嵌入到自己的程序内。
而且话又说回来,以现在的技术水平所能达到地完美程度。钱长友还不屑于剽窃。
经过从昨天下午到现在的连续奋战,钱长友对于DOS下面的编程模式已经彻底地熟悉起来。那个提取字库的程序已经彻底完成,通过软盘贝到装有汉卡的台式机上,稍微设置了一下参数,很快便得到了想要的数据。
钱长友欣欣然之余,吴云飞则是看得有些莫名其妙。
其实,钱长友所研发的汉卡,可以称之为汉字信息处理系统,它包括编码、输入、存储、编辑、输出和传输等等诸多环节。其中编码是最关键的,只有解决了这个问题,汉字才能进入计算机。
在用户最直接感受到的输出方面。为了将汉字在显示器或打印机上显示出来,需要把汉字按图形符号设计成点阵图,比如×4等。进而得到相应的点阵代码,即字形码,全部汉字字形码地集合就叫汉字字库。
限于目前的计算机硬件水平。汉字库多数固化在一个单独地存储芯片中,形成“硬”字库的方式,然后再和其它必要的器件组成接口卡,插接在计算机上,最终成为汉卡。
钱长友如果把现在已有的汉字库借鉴过来,将会节省很多的研发时间。
另一方面,用户平常接触最多的诸如拼音、五笔之类的输入法,均会形成各自不同的汉字输入码,这些编码统统属于汉字外码。钱长友在整理完字库后,随后的任务就是完成输入法的相关编程工作。
输入法形成地汉字外码必须在计算机中转换成机内码,即汉字内码,才能进行存储和处理。汉字内码与每一个汉字或者标点符号都是一一对应的,汉
和汉字内码之间的转换有统一的标准,在国内就是一始实施地国家标准GB12——=
GB12准共收录6763个汉字,其中一级汉字3755,二级汉字个,同时,还收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682全角字符。
GB12收录的汉字已经覆盖大陆99。75%地使用频率,基本能够满足汉字的计算机处理需要,但它对于人名、古汉语等方面出现的罕用字,则无能为力,这才导致了后来GB及GB030字字符集标准的出现。
凭借钱长友的水平,完全可以克服这些弊端,但计算机作为一个产业来讲,是需要各个环节配合的。GB2312码通行于大陆,几乎所有的中文系统和国际化的软件都必须支持它,钱长友的工作也必
本章未完,点击下一页继续。