飞凌干货-printf数据打印的归宿

罗罗诺亚 · 发表于 2022-5-23 14:06

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

本帖最后由 Heaven_1 于 2022-5-24 14:17 编辑

关于printf

printf是一个接口，跟UNIX标准IO的write系统调用类似，但是更像[color=inherit !important]C库的fwrite，因为同系列的函数中还有一个fprintf(至于同系列其它的函数，请自行man)。printf和fwrite的区别在于两点：

1.它可以格式化输出，如果用fwrite，它接受的是一个固定的buffer，你不得不在调fwrite之前先使用sprintf之类的函数格式化buffer；

2.它免除了你的fopen-fwrite-fclose这个序列的调用，因为它直接将格式化的内容写入UNIX进程自然打开的1号文件描述符，即标准输出。

既然printf写入了标准输出，那么接下来就要定义什么是标准输出。在早期UNIX年代，人们在终端或者伪终端操作机器，那时的输入基本都是键盘，磁带更古老的东西，而输出就是一个计算结果，需要展示出来给人看的那种，一般为终端屏幕，也可以是一条纸带，那么程序怎么知道输入和输出到底是什么呢？这就需要程序明确指定。UNIX的“一切皆文件”思想以及“分离抽象”思想彻底改变了这一切。

UNIX定义了抽象文件描述符0，1，2分别为标准输入，标准输出，标准错误输出。至于它们到底对应什么设备，你可以在程序初始化的时候显式重定向到任意设备，也可以在外部shell做类似的重定向，这样就把指明设备这件事从程序分离了出来。

我为什么不统一说一下fwrite调用对程序性能的影响呢？因为该调用之前你必须执行fopen，而fopen的一个参数明确表示了你希望写入的对象是什么，这就不会带来异议，毕竟如果你非要在性能测试的时候写CF卡，那也是你愿意。printf就不同了，它对效率的影响取决于标准输出是什么以及你是如何重定向标准输出的，所谓的标准输出并不是真实的设备，它只是一个抽象层，具体如何解释标准输出，还要依靠外部。

数据都去哪儿了

我以下面这个超级小的程序来说明printf的时候，数据都去哪了：
& J6 _! k  B: k# V; e#include <stdio.h>% d( ]( H8 i) b  v6 |
#include <stdlib.h>5 [% O- m; _' n; h4 N4 |
int main(int argc, char **argv): P5 h) I$ W* i$ P% e
{    int i = 0;
$ i+ {% S/ j, |5 Yint c = atoi(argv[1]);
3 Y( `* {. f3 L1 Q( h. g       for(; i < c; i++) {             8 @, h7 V% F+ T, O
printf("############  %d\n", i);
6 G, n9 r  @3 [& {}       return 0;3 V2 T  q5 `3 X& g  {. O, u2 e4 e( S
}

我先给出结果：
/ u2 F, Y. W4 s$ c" v& L% _( _1.在/dev/tty1上直接执行time ./test 1000: ?- p7 P# _- h  E0 c
... #########  995, X, Y/ k: K  f( o' m+ v7 B; I' k
#########  996& a, p1 S3 N* Y
#########  997
" A" m  K- K) R# k* M, T#########  998
" G! N1 T! t1 V1 x& I#########  999, }. k9 C5 J5 K# \) {/ O" @
real 0m0.414s
' P( A# W( N. W: _+ S1 b1 ~4 ?user 0m0.003s4 L# y5 f8 b  ?! j1 }
sys    0m0.411s* R, K7 q  \: A
& R, \* l1 a, U$ B8 g$ r
2.在/dev/tty1上执行time ./test 1000 >/dev/tty2
, \: u- `( F  J0 T4 u  n/ Hreal 0m0.007s% u7 b$ J/ Y- |0 [' s6 F2 o4 }* B
user 0m0.003s  l# m5 C$ V+ x! X0 r
sys    0m0.007s
3 u, Z4 J( g- o, E" v3.在SecureC[color=inherit !important]RT上执行time ./test 10001 A- ], [; P6 Q; g. \/ b0 _
...
) {% a" u5 a  p* g/ N#########  997/ @! I% S4 A2 A2 o8 F3 R
#########  998
0 c: I5 Y# x& c$ \0 s1 N( g  n#########  999
5 x, q+ p0 }( Y8 Greal 0m0.010s+ C$ g9 ]# k* @7 B# f
user 0m0.002s
) I' y9 O; w7 e4 l% h8 ^: Jsys    0m0.003s& b! ]0 m( Z. k  I1 n! [' D$ [2 ]
! T0 x* I. ]" K* z0 ~  ]0 @
在SecureCRT上执行time ./test 100000 >/dev/tty1,此时不切换tty
2 ~4 Y8 J. K0 U5 }; p: I$ G...
: e7 J2 |& _# P. L  C$ p等了几秒，无结果，于是在键盘按下Alt-F2，切换到第二个tty，马上显示出了结果：
2 ~* c( L2 }2 o2 Y& y" s& Z  W5 Preal 0m4.276s
- |* k5 Y% [( A3 v% buser 0m0.066s
( w2 X1 O; m# }9 w2 O0 rsys    0m4.204s
% y0 I0 m: ?5 t; _" L" }. {/ F7 R5.在tty1上执行time ./test 100000 >/dev/tty2：1 C0 ]5 x9 W3 T  U' Q- {
real 0m0.499s( e$ T* \- E/ X/ o# g) _! Y3 U( a
user 0m0.081s
$ n5 }, A6 `; n$ P" x* Msys    0m0.410s
& c5 H2 L7 W+ l' z! Y! J. R; v, X6.在tty1上执行time ./test 100000 >/dev/null9 s; r% M3 w  R! k
real 0m0.030s, T* R& J5 M) N4 t8 i0 q) \" g3 M
user 0m0.028s4 s+ s9 _. _/ `% C
sys    0m0.001s

通过以上的结果数据，我们可以得到以下的结论：8 X7 O) E Z* ?: {% E! W
a.对于tty终端而言，如果当前终端不是写入的终端，那么开销主要在内核态，且开销不是很大；
% G: }+ L: x& F9 d; o3 U5 Wb.对于tty终端而言，如果当前终端是写入的终端，那么开销主要在内核态，且开销很大；( q& w1 w6 _' I
c.对于不管是tty还是远程的pty终端，写入/dev/null的开销主要在用户态，开销不大；
# y$ E" k* K" ?! B: Bd.对于pty远程终端(/dev/pts/X)，不管写入的是不是当前的pty终端，开销主要在内核态，且开销不是很大* \ p: [( u; ^3 E2 q7 a
e.对应上面的结果和结论，下面给出一幅图解，详细解释一下printf冰山下面的秘密：
2 Z$ R1 y+ Y; G. Q

线路规程串口举例：

简易图如下：

我想上图已经很清楚了，如果不懂什么叫行规程(也叫线路规程)的话，请阅读《UNIX环境高级编程》的终端和伪终端章节，简单来说，它就是一个中间层，用来适配VFS接口和底层的具体驱动，比如解释和处理控制字符等。从上面的图中，我们可以看出，主要的开销几乎都集中在底层，而底层却偏偏是我们不能控制或者很难控制的。之所以上面的测试例子中ssh登录的终端对test性能的测试效果良好，但是那是因为网络环境好，你在一个64kbps相隔5k公里的线路上试一下。

小小的printf下面竟然藏着如此多的内容，并且很可能就是它成了你的程序的性能瓶颈，因为最底层的影响因素往往是不可控的。那么是不是就是意味着我要建议大家从来不用printf打印呢？或者说干脆就不要用标准输出呢？并不是这样。但是为何不把打印这种事交给本机的另一个进程呢？事实上，几乎所有的需要记录日志的系统都是这么做的，而syslog则迎合了这个思想。这种思想的背后就是“用可控制的一次IPC替换不可控制冰山之下的茫茫深海

关于日志记录

日志记录一直都是“薛定谔猫”式的东西，因为日志记录作为一段代码，它已经是程序的一部分，不可能独立地观察程序的行为，如果说用镜像系统的话，那么这种行为就是被动的，你不得不镜像每一条指令，以发现一些关键的信息，要想主动记录关键事件，必须用日志系统。打印日志可以方便信息获取和审计，但是代价有时也是高昂的：. Y9 d, ]. j4 w5 d
1.你要设计一套日志回滚系统，防止存储空间被撑爆；- Y! w/ D+ A5 h0 k8 L- J! M
2.你要让日志记录尽快完成，不能降低关键路径的性能；
4 A9 \* @( r' q0 A9 G6 `3.你要反复调试代码，确保日志记录的缓冲区不会溢出；% y$ @9 F7 v }2 F
4.为了让日志更短，语言能力不好的人组织的日志就像电报一样难以理解。
4 p/ P9 l6 f8 r( v...
! k) E7 _- F+ P0 K6 X我认为，日志记录应该遵循以下的原则：

1.除非必须要把事件发生的时间记录下来，否则就用计数器代替日志记录，一系列的事件映射成一系列的计数器，由用户决定什么时候查看事件发生了。事实上，[color=inherit !important]Linux的网络子系统就是用的这种方式，所有的/proc/net/netstat就是这个查看接口。

2.一定要有一个日志级别控制选项，用户可以决定是否记录日志，以及记录的日志详细到什么程度。

tty层接口

驱动代码摘自：

lichee/linux-3.10/drivers/tty/serial/sunxi-uart.c

接收数据

static unsigned int sw_uart_handle_rx(struct sw_uart_port *sw_uport, unsigned int lsr)

{

….

tty_flip_buffer_push(&sw_uport->port.state->port);

…

}