Unicode与Ai_VB.net_黑客防线网安服务器维护基地--Powered by WWW.RONGSEN.COM.CN

Unicode与Ai

作者:黑客防线网安VB教程基地 来源:黑客防线网安VB教程基地 浏览次数:0

本篇关键词:处理Unicode'StrConv
黑客防线网安网讯:VisualBasic32-bit版本的字串处理采用Unicode,也就是说字串在VB内部是以Unicode的格式来存放。    何谓Unicode?简单的说,就是每一个字元都是以2-byte的型式表示,而每个「实体字元」...
VisualBasic32-bit版本的字串处理采用Unicode也就是说字串在VB内部是以Unicode的格式来存放
  
  何谓Unicode?简单的说就是每一个字元都是以2-byte的型式表示,而每个「实体字元」就是一个「字元」因此,
  
  Len("大家好")
  Len("abc")
  
  所传回的值都是3,因为「大」和「a」都是一个字元。
  
  但是这对一些中文字串处理,例如纯文字的资料档,却是一个大灾难,因为你必须以byte来定位每个字元,可是Unicode却把一切的处理全搞砸了。例如:
  
  Len("GoodMorning")传回12,而
  Len("今天天气很好")传回6
  
  对初学者而言,好不容易能使用VB来写程式已经是件了不起的事了,却马上在中文处理上挨了一记闷棍,所受到的打击实在不小。但是不要怕,事实上只要再多了解一些指令,就可以把中文处理的问题解决了。
  
  是什麽指令呢?最重要的莫过於StrConv了。StrConv函式的语法为:
  
  StrConv(待转换字串,转换格式)
  
  其中转换格式在这里用到的是:
  
  vbUnicode将Ansi字串转换为Unicode
  vbFromUnicode将Unicode字串转换为Ansi
  
  将字串转成Ansi之後,所有的字串处理指令都要加个B,例如:LeftB,RightB,MidB,ChrB,InstrB,LenB,InputB等。例用这些指令来处理就行了。
  
  当你处理完毕之後,你可以再将它再转回Unicode,这样就可以使用一般的字串处理指令了。
  
  这样讲看得懂吗?如果还是不了解,看看下面的实例说明:
  
  [●]简易使用范例
  
  看看下面的基本范例您应该就会对VB的字串处理方式有些概念。
  
  PrivateSubCommand1_Click()
  DimsUnicodeAsString
  DimsAnsiAsString
  
  'Unicode运算
  sUnicode="王小明,A123456789,651023,台北市中山路100号,(02)2345678"
  Debug.PrintLen(sUnicode)'传回44
  Debug.PrintMid$(sUnicode,5,10)'传回A123456789
  Debug.PrintInstr(sUnicode,"台北市")'传回23
  
  '将Unicode字串转成Ansi
  sAnsi=StrConv(sUnicode,vbFromUnicode)
  'Ansi运算
  Debug.PrintLenB(sAnsi)'传回54
  Debug.PrintMidB$(sAnsi,8,10)'传回?????,因为忘了转回Unicode
  Debug.PrintStrConv(MidB$(sAnsi,8,10),vbUnicode)'传回A123456789,请注意转回Unicode的动作一定要做
  Debug.PrintInStrB(sAnsi,StrConv("台北市",vbFromUnicode))'传回23,不要忘了要把"台北市"也转成Ansi,否则会找不到
  EndSub
  
  [●]读入文字档
  
  在VB的小技巧中,有一个是快速读档法:
  
  PrivateSubCommand1_Click()
  DimsFileAsString
  
  Open"C:filename.txt"ForInputAs#1
  sFile=Input$(LOF(1),#1)
  Close#1
  EndSub
  
  但是很不幸地,如果你读取的档案内含中文字,那上面这段程式会出现Inputpastendoffile的错误。因为LOF传回的是档案的byte数,而Input函式读取的是字元数,由於档案内含中文,因此档案中的字元数将会小於byte数,於是就发生错误了。
  
  要解决这个问题,我们就要用到StrConv和InputB这两个函式了:
  
  PrivateSubCommand1_Click()
  DimsFileAsString
  
  Open"C:filename.txt"ForInputAs#1
  sFile=StrConv(InputB$(LOF(1),#1),vbUnicode)
  Close#1
  EndSub
  
  上面修正程式先用InputB将档案读进来,不过使用InputB所读入的档案是Ansi格式的,所以要再用StrConv转成Unicode才行。
  
  [●]随机资料档
  
  许多文字资料档是以固定位元组的位置来加以区格,例如下面的资料格式:
  
  王小民650110台北市中山路100号(02)1234567
  张大呆660824花莲县大甲镇广东街23号(03)9876543
  ......
  
  像这种类型的档案要如何处理呢?这是就必须用到Type以及bytearray了。
  
  PrivateTypetagRecord
  Username(5)AsByte'姓名6bytes
  Birthday(5)AsByte'生日6bytes
  Address(21)AsByte'地址22bytes
  TEL(11)AsByte'电话12bytes
  CrLf(1)AsByte'换列字元2bytes
  EndType
  
  PrivateSubCommand1_Click()
  DimuRecordAstagRecord
  
  Open"C:filename.dat"ForRandomAs#1Len=LenB(uRecord)
  Get#1,2,uRecord'取第二笔资料
  
  WithuRecord'With...EndWith应该会用吧
  Debug.Print.Username'传回???
  Debug.PrintStrConv(.Username,vbUnicode)'传回"张大呆"
  EndWith
  
  Close#1
  EndSub
  
  在这个例子中,一定要用到bytearray,因为只有bytearray才能正确地定位到每个byte的位置。以前使用字串来定位的方法已经不适用了,千万要记住!但是使用bytearray所读入的资料是Ansi格式,若要处理或是做运算的话,记得还要转成Unicode格式才行。
  
  [●]使用ByteArray
  
  除了上面必须使用byte精确定位的例子之外,纯文字的处理基本上是用不到bytearray的。bytearray通常是用在处理binary资料。->

    黑客防线网安服务器维护方案本篇连接:http://www.rongsen.com.cn/show-14503-1.html
网站维护教程更新时间:2012-04-03 01:07:53  【打印此页】  【关闭
我要申请本站N点 | 黑客防线官网 |  
专业服务器维护及网站维护手工安全搭建环境,网站安全加固服务。黑客防线网安服务器维护基地招商进行中!QQ:29769479

footer  footer  footer  footer