导入数据时, 很多sql或者excel导出的csv文件会在string值中包含换行符("\n", "\r"), 通过双引号标示出单个数据值.
例如数据包含着2个变量, ID和说明(description):
id, description
1, "this is 1st description; (这里包含行符"\n")
this is 2nd description."
2, "this is a description."
...
由于在原始sql数据库中, 说明1 的分号后包含换行, 说明2 在导出的csv文件中会自动跳到第二行. 如果用sas直接导入该csv数据, 会误将1行数据分割成2行数据而发生错误.
去掉换行符后, 正确数据应该为:
id, description
1, "this is 1st description; this is 2nd description."
2, "this is a description."
...
这边网上的文章中, 作者先计算整个数据中的双引号, 如果发现换行符在奇数个的双引号之后, 则替换换行符, 来使得数据可以者正确读入sas.