CSV(文件格式)

2023-02-02 54阅读

温馨提示:这篇文章已超过541天没有更新,请注意相关的内容是否还可用!

CSV

文件格式

逗号分隔值(CSV)文件包含以纯文本形式列出的表中的数据,例如电子邮件联系方式。虽然CSV文件可以用很多程序打开,比如文本编辑器,但是它们包含的数据最好使用电子表格程序来查看,比如Microsoft Excel、OpenOffice Calc或Google Sheets。

中文名CSV
外文名Comma Separated Values
别名逗号分隔值
应用在程序之间转移表格数据

用法

CSV是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的和/或无规范的格式)。因为大量程序都支持某种CSV变体,至少是作为一种可选择的输入或输出格式。

例如,一个用户可能需要交换信息,从一个以私有格式存储数据的数据库程序,到一个数据格式完全不同的电子表格。最可能的情况是,该数据库程序可以导出数据为“CSV”,然后被导出的CSV文件可以被电子表格程序导入。

“CSV”并不是一种单一的、定义明确的格式(尽管RFC4180有一个被通常使用的定义)。因此在实践中,术语“CSV”泛指具有以下特征的任何文件:纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;由记录组成(典型的是每行一条记录);每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);每条记录都有同样的字段序列。

在这些常规的约束条件下,存在着许多CSV变体,故CSV文件并不完全互通。然而,这些变异非常小,并且有许多应用程序允许用户预览文件(这是可行的,因为它是纯文本),然后指定分隔符、转义规则等。如果一个特定CSV文件的变异过大,超出了特定接收程序的支持范围,那么可行的做法往往是人工检查并编辑文件,或通过简单的程序来修复问题。因此在实践中,CSV文件还是非常方便的。

规则

开头是不留空,以行为单位。可含或不含列名,含列名则居文件第一行。一行数据不跨行,无空行。以半角逗号(即,)作分隔符,列为空也要表达其存在。列内容如存在半角逗号(即,)则用半角双引号(即"")将该字段值包含起来。列内容如存在半角引号(即")则应替换成半角双引号("")转义,并用半角引号(即"")将该字段值包含起来。文件读写时引号,逗号操作规则互逆。内码格式不限,可为ASCII、Unicode或者其他。不支持特殊字符。

规范

逗号分隔列出日期之前,尽早从个人电脑,但被广泛应用于最早前IBM个人电脑时代的个人电脑磁带存储备份和交换的信息的数据库机器的两种不同的架构。在这一天,负担得起的硬盘驱动器不存在,和许多小型企业试图实现效益的计算使用软盘的软件。

CSV没有通用标准规范。不同的程序间CSV的标准有差异很常见,这可能导致交互操作困难。互联网通信的CSV文件,资料的IETF文件(符合RFC4180于2005年10月)介绍了格式的“text/csv格式”MIME类型登记的IANA负责。另一个相关的规格是由派出文字其中也包括CSV格式。许多非正式文件的存在,说明CSV格式。如何:逗号分隔值(CSV)文件格式概述了CSV格式中使用最广泛的应用和解释它如何能最好地利用和支持。

参考资料

1.如何打开CSV文件·wikiHow

目录[+]