Linux系统运维之Linux与Windows下txt文件区别
白羽 2018-07-11 来源 :网络 阅读 1419 评论 0

摘要:本文将带你了解Linux与Windows下txt文件区别,希望本文对大家学Linux有所帮助。



在Linux下处理从Windows平台通过TCP socket发送过来的文本文件,主要是利用算法对文本中的字符串进行变换,算法在linux下实测通过,但联调的时候一直不对…… 通过调试发现从文本文件中读出来的字符串长度不对,多了一个字节。搜了一下发现:

换行符在Linux和Windows下的区别

 
一、区别
换行符:    
1.windows中的换行符是\r\n,
2. linux/unix下的换行符是\n。
其中:
回车符:\r=0x0d (13) return; #回车(carriage return)
换行符:\n=0x0a (10) newline。#换行(newline)
     
二、文件格式互转命令
1.unix2dos:将具有unix风格的格式文件转化为具有window下的格式文件。
2.dos2unix:将具有windows风格的格式文件转化为unix下的格式文件。
 
Reply-text mb10代码  
windows的换行符是\r\n Linux采用的是\n  
可以采用unix2dos或dos2unix转换文本文件
 
 
三、回车换行符的历史背景
早期的计算机输出设备不是显示器,而是电传打字机,结构与普通的打字机差不多。有一个打印头在纸上打字,同时有一个电动机控制纸张的进出。当打印头到达行尾的时候,需要两个动作才能够到达下一行的行首:首先执行回车动作,将打印头移动到本行的行首,然后进行换行动作,电动机将纸张向上移动一行,这样打印头就处于下一行的行首,可以继续进行打印。回车和换行对应的控制字符分别是\r和\n,这就是windows中换行符为\r\n的由来。后来由于经常连续执行,所以在打印机中将这两个控制字符简化为一个控制字符,这就是linux/unix中的换行符\n的由来。
Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“ <回车><换行>”,即“\r\n”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号.
 
四、引起的现象和问题:
 
1.问题一
做一个日志文件的时候发现由printWriter写出来的文件在windows上打开 是混乱的,因为在linux下执行printLn方法时 写入的换行符是\n ,在windows没法识别\r\n才能被认为是换行
 
2. 问题二 
有时在WIN下编辑好的脚本文件上传到LINUX服务器中不能正常执行,开始误认为是LINUX配置问题,后来发现,是WIN与LINUX存储文件时的换行符标志不同造成的。在DOS使用的换行符为 ^M$,我们称为CR与LF两个符号。而在Linux中,则仅有LF ($) 这个换行符。
  可以用如下命令完成格式转换:$dos2unix,$unix2dos。但这两个命令在Ubuntu发行版本中不存在,可通过:
  $sudo apt-get install tofrodos
  命令安装。之后,再次使用如下文所示的格式即可。
  [root@linux ~]# dos2unix [-kn] file [newfile]
  [root@linux ~]# unix2dos [-kn] file [newfile]
  参数:
  -k : 保留该文件原来的mtime时间格式(不更新文件上次内容经过修改的时间)
  -n : 保留原来的旧文件,将转换后的内容输出到新文件,如:dos2unix -n old new
  范例:
  范例一:将提供的hosts文件格式更新为dos格式。
  [root@linux ~]# unix2dos -k hosts
  unix2dos: converting file hosts to DOS format ...
  # 此时hosts文件的时间不会改变,但内容主要将换行符修改成为DOS的CRLF了。
  范例二:将范例一已经变成DOS格式的hosts改名为hosts.dos,并且转换Linux
  格式到hosts.linux
  [root@linux ~]# mv hosts hosts.dos
  [root@linux ~]# dos2unix -k -n hosts.dos hosts.linux
  dos2unix: converting file hosts.dos to file hosts.linux in UNIX format ...
  [root@linux ~]# ll
  -rw-r--r-- 1 root root 288 Aug 1 13:30 hosts.dos
  -rw------- 1 root root 279 Aug 1 13:30 hosts.linux
  # 由于DOS格式中多了CR字符,所以,文件比较大。
 
3. 现象三
先生成一个换行(\n, 0x0A)和回车(\r, 0x0D)组合的文本
$ echo -en '12\n34\r56\n\r78\r\n' > tmp
以十六进制方式查看文本
$ od -t x1 tmp
0000000 31 32 0a 33 34 0d 35 36 0a 0d 37 38 0d 0a
0000016
 
五、编程相关
 
文本文件的行结束符,传统上 PC机 用 CRLF,苹果机用CR,unix 用 LF。【CR -- 回车符,c语言'\r'】。【LF -- 换行符, c语言'\n'】。
不同计算机上c语言统一规定为::文本文件的行结束符一律变成一个符号LF,也就是换行符,也就是new line符, 也就是'\n'. “回车和换行符转换成一个换行符”
-- 对PC机而言,文本文件行结束符,CRLF读入后,丢掉CR,留 LF. 例如fgets() 读入一行,行尾只有LF,没有CR.
在解析文本或其他格式的文件内容时,常常要碰到判定回车换行的地方,这个时候就要注意既要判定"\r\n"又要判定"\n"。写程序时可能得到一行,将其进行trim掉'\r',这样能得到你所需要的string了。
'\n' 10 换行(newline)
'\r' 13 回车(return)
 
最后:
ctrl+M: ^M 也称回车键

 


本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标系统运维之Linux!


本文由 @白羽 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程