Asp生成UTF-8格式的文件(编码)

来源:岁月联盟 编辑:zhuzhu 时间:2009-03-10

ASP中操作UTF-8格式的文件
注意:这里说的ASP可不是ASP.net。
ASP由于是一种古老的语言,它的一些功能对UTF-8支持非常差。
比如,你想生成一个UTF-8格式的文件,使用常用的 Scripting.FileSystemObject 对象就不行。

Scripting.FileSystemObject 对象创建文件的函数,是下面方式:
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])

其中的 unicode 属性是这样描述的:

可选项。Boolean 值指明是否以 Unicode 或 ASCII 文件格式创建文件。如果以 Unicode 文件格式创建文件,则该值为 True;如果以 ASCII 文件格式创建文件,则该值为 False。如果省略此部分,则假定创建 ASCII 文件。

我们是无法用这个函数来创建UTF-8格式文件的。
这时候,我们可以使用 ADODB.Stream 对象,使用方法见下面:

以下是引用片段:
Set objStream = Server.CreateObject("ADODB.Stream")
    With objStream
    .Open
    .Charset = "utf-8"
    .Position = objStream.Size
    .WriteText=str
    .SaveToFile server.mappath("/sitemap.xml"),2 
    .Close
    End With
Set objStream = Nothing

附:
ASCII 、Unicode 、 UTF-8 介绍:
ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127。

由于 ASCII 表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符集,比如在中国应用非常广泛的 GB2312,它为汉字提供了编码,用两个字节表示。

这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。
Unicode 是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),比如字母 a 对应的数字 0x0041。目前 Unicode 还处于发展中,它所包容的字符越来越多。 

在将 Unicode 表示的字符进行存储时,还需要一定的编码方式,比如 UCS-2,它用两个字节来表示 Unicode 编码的字符。而 UTF-8 是 Unicode 字符集的另外一种编码方式,它是变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字符集的结果一样,因而具有非常好的兼容性,ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理,应用非常广泛。

完整示例:

 ’================================================
 ’函数名:CreatedTextFiles
 ’作  用:创建文本文件
 ’参  数:filename  ----文件名
 ’        body  ----主要内容
 ’================================================
 Public Function CreatedTextFiles(ByVal FileName, ByVal body)
  On Error Resume Next
  If InStr(FileName, ":") = 0 Then FileName = Server.MapPath(FileName)
  Dim oStream
  Set oStream = CreateObject("ADODB.Stream")
  oStream.Type = 2 ’设置为可读可写
  oStream.Mode = 3 ’设置内容为文本
  oStream.Charset = "UTF-8"
  oStream.Open
  oStream.Position = oStream.Size
  oStream.WriteText body
  oStream.SaveToFile FileName, 2
  oStream.Close
  Set oStream = Nothing
  If Err.Number <> 0 Then Err.Clear
 End Function

调用示例:

 Dim strContent
  Dim filePath
  FilePath="../text.txt"
 strContent = "启东信息港,为企业创建一个搜索神话!xker.Com"
 CreatedTextFiles filePath, strContent’生成UTF-8编码的文件