|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
最近,看了很多关于uboot的分析,其中就有说要为C语言的运行,就要准备好堆栈。
1 X* E! r: z2 n" z$ `5 d1 C& y) K2 j: e) W: r5 F% `$ Y
/ H+ h; n7 u5 Y7 \. t: g; Y5 a5 |2 D0 A: d, [+ y5 U6 i3 [& P+ ^* M
而在Uboot的start.S汇编代码中,关于系统初始化,也看到有堆栈指针初始化这个动作。但是,从来只是看到有人说系统初始化要初始化堆栈,即正确给堆栈指针sp赋值,但是却从来没有看到有人解释,为何要初始化堆栈。今天,我们就来试图解释一下,为何要初始化堆栈,即:3 V/ T* b: \: D9 R$ m) }# _# s
) h0 U L w( W6 I8 [7 l' ]+ \; H# h: m/ {/ M) o! ?0 a# X I& M1 @( d9 {8 w) _! N2 O8 P6 P
2 X: s/ J( z$ h: x为何C语言的函数调用要用到堆栈,而汇编却不需要初始化堆栈?6 g1 f8 b* z' h* m
& }1 S& [5 d# U) w6 N% K2 G( P, v% ]8 t0 W/ ?9 ~) B. b$ \4 y/ X
+ l% i4 g5 |! n, u- ]* M9 U" I" x% [8 ^' `$ r+ Y
要明白这个问题,首先要了解堆栈的作用。
+ Y5 ^( U! V. y3 s9 r: O; A: [" c1 e% q& t* ^8 B% d( I; g5 F: T
) H* e, g* Q \ g4 k: H( H- U5 b$ |; |- y* z& ?
关于堆栈的作用,要详细讲解的话,要很长的篇幅,所以此处只是做简略介绍。
4 @" P0 R4 m: U, y4 [. l e0 r
4 X( B6 z, @( l) g总的来说,堆栈的作用就是:保存现场/上下文,传递参数。
/ r& h. s6 m$ a' ~0 |- g E! p+ c& q0 P2 U% X5 a, ^" s# [
8 e: Y3 P9 i# ?' i: e/ I3 ^6 ^2 B
; H8 y9 U1 Y. c& D6 t7 H1.保存现场/上下文
}# x2 L5 W7 n" r: r# |现场,意思就相当于案发现场,总有一些现场的情况,要记录下来的,否则被别人破坏掉之后,你就无法恢复现场了。而此处说的现场,就是指CPU运行的时候,用到了一些寄存器,比如r0,r1等等,对于这些寄存器的值,如果你不保存而直接跳转到子函数中去执行,那么很可能就被其破坏了,因为其函数执行也要用到这些寄存器。( P$ W3 y& d9 }& e! K( r$ S% [+ X* [6 l
2 j" }) {9 d- H/ m8 H7 d因此,在函数调用之前,应该将这些寄存器等现场,暂时保持起来,等调用函数执行完毕返回后,再恢复现场。这样CPU就可以正确的继续执行了。" x( @; P( F: ^8 c7 I+ g
1 f% r. P T: j# ^# T: D% z
在计算机中,你常可以看到上下文这个词,对应的英文是context。那么:
6 u2 z& f# z1 i; S+ s: O8 A- o W. \, H p) G
1.1.什么叫做上下文context7 O" J H+ V7 d2 e
保存现场,也叫保存上下文。4 P/ A; x$ H( V- X6 m3 B2 D0 H& [% l
+ o2 J" c1 X0 J2 I5 Z
7 u, Z2 ~$ D6 h# R1 S/ W) w& {! p! n# f) I; S' }* I9 j
上下文,英文叫做context,就是上面的文章,和下面的文章,即与你此刻,当前CPU运行有关系的内容,即那些你用到寄存器。所以,和上面的现场,是一个意思。. L. B# J+ J( H
) F1 m: Y- Q T
8 G1 t I4 t( `9 n0 \保存寄存器的值,一般用的是push指令,将对应的某些寄存器的值,一个个放到堆栈中,把对应的值压入到堆栈里面,即所谓的压栈。' g7 M; ~' W' J$ N$ b
g7 N9 r2 ^5 R" w# z1 S9 B& e/ C; |: O# Y3 G# Q4 Y. ~/ T N
. }+ d0 U4 E% ~! V0 Z: J2 t8 u$ A1 {$ q: ]0 r* k' c$ e9 R8 C$ P; i8 j
然后待被调用的子函数执行完毕的时候,再调用pop,把堆栈中的一个个的值,赋值给对应的那些你刚开始压栈时用到的寄存器,把对应的值从堆栈中弹出去,即所谓的出栈。
: X7 R2 A( a3 S& u5 f. Z; m% z+ N ]6 c
其中保存的寄存器中,也包括lr的值(因为用bl指令进行跳转的话,那么之前的pc的值是存在lr中的),然后在子程序执行完毕的时候,再把堆栈中的lr的值pop出来,赋值给pc,这样就实现了子函数的正确的返回。; k6 s! F- y1 D* h2 N; L; r7 ~' A1 i' Q+ ^# B8 k
+ W# a, o: d* }8 v+ o: j: J! S% P' N( `) c# Z- g4 y
2.传递参数- v: P* A9 {( r3 W8 U1 k- }* X4 L- b- u3 e0 p$ ^" F$ ?4 Z
C语言进行函数调用的时候,常常会传递给被调用的函数一些参数,对于这些C语言级别的参数,被编译器翻译成汇编语言的时候,就要找个地方存放一下,并且让被调用的函数能够访问,否则就没发实现传递参数了。对于找个地方放一下,分两种情况。2 v0 t" @# h3 C" _" c* y: _$ h/ ~! _& E) R) }0 o1 f9 F# r. [
! C/ X* C$ F9 ^, D$ K' g1 ~
" H6 m) |5 f+ d8 U! y2 V5 @一种情况是,本身传递的参数就很少,就可以通过寄存器传送参数。 V2 r) v6 M2 |4 P$ @! {
0 {9 O; |4 D1 V$ @1 K j- a4 \
因为在前面的保存现场的动作中,已经保存好了对应的寄存器的值,那么此时,这些寄存器就是空闲的,可以供我们使用的了,那就可以放参数,而参数少的情况下,就足够存放参数了,比如参数有2个,那么就用r0和r1存放即可。(关于参数1和参数2,具体哪个放在r0,哪个放在r1,就是和APCS中的“在函数调用之间传递/返回参数”相关了,APCS中会有详细的约定。感兴趣的自己去研究。); i! J& m" m; w. l; y: W9 J, J2 L& g! H7 @
0 ]9 ]) G; ]. H7 C但是如果参数太多,寄存器不够用,那么就得把多余的参数堆栈中了。8 u, a! w7 c4 N# f' |" S' Z% i, B* p2 S, n, k$ H
/ I, S" j( B, D T/ H3 x
即,可以用堆栈来传递所有的或寄存器放不下的那些多余的参数。8 G, a! E% P1 w7 ~& V
" T4 `4 p3 o3 Z! s8 e
& { ^3 l& A; r# E0 p Y$ ?! O3.举例分析C语言函数调用是如何使用堆栈的! z* V' k! G, p( y) P* x% i: U2 e* S, t6 ^8 [
对于上面的解释的堆栈的作用显得有些抽象,此处再用例子来简单说明一下,就容易明白了:7 H7 D0 S/ Q( Y' Y4 a! g G
( B1 q" T- i1 l+ P0 r
% \1 H: ]( {, [3 f+ n7 \
用: N7 g) q I# F& O2 C
4 ]3 v4 _0 f e
% r/ i; K; ~" Y* l, ]4 s! r- F5 }
1. ARM-inux-objdump –d u-boot > dump_u-boot.txt% H+ y' t. O. X. N4 g( N. l
5 A7 N, }' h2 h& a7 T: T4 j7 h7 ]: Z
# u! ]4 l, e7 E" X9 ?4 B2 s6 M5 {' S& n! F8 E/ r! }9 U
可以得到dump_u-boot.txt文件。该文件就是中,包含了u-boot中的程序的可执行的汇编代码,其中我们可以看到C语言的函数的源代码,到底对应着那些汇编代码。0 ~* S3 D7 L* Z: V" H" \% c" {: X; Z( ?, w& Z$ J
! U: v2 W1 l1 y& L# c/ w
2 J! z" g5 ] _& X下面贴出两个函数的汇编代码,7 l/ U7 r3 R; J U+ b8 \$ u3 p/ [
; z; d- l- ^# V! \! B% s- O一个是clock_init,. V. j# O6 q; \9 N4 t; _1 C
另一个是与clock_init在同一C源文件中的,另外一个函数CopyCode2Ram:; n; n/ f+ d! @' C& G" Q7 R- k1 ]2 n; S( D) Y0 r" j5 n) f+ K
5 g$ l2 Z, n/ m9 Q, y+ X1. 33d0091c <CopyCode2Ram>:
& v( Y! t/ x, P2. 33d0091c: e92d4070 push {r4, r5, r6, lr}
: ^, Z, B8 _9 Y3 O, Y3. 33d00920: e1a06000 mov r6, r0, H5 M/ J' l& `) u) w
4. 33d00924: e1a05001 mov r5, r1. A- P# G' \8 M. D2 A2 M
5. 33d00928: e1a04002 mov r4, r2
' b! W( g' Z( _% A6. 33d0092c: ebffffef bl 33d008f0 <bBootFrmNORFlash>! W4 B* j7 f; b0 X; p) \
7. ... ...7 U( m' x( P9 V8 o/ D9 E) O2 Q3 P6 {
8. 33d00984: ebffff14 bl 33d005dc <nand_read_ll>. e! F3 s5 r) E Z1 W$ b1 W0 A* p1 a" t. C; O: ?9 W% h4 z& [5 v8 m7 Y2 o" k
9. ... ...) x6 ]3 K: {+ J1 f) @3 q! v
# V& M8 B) z" x F& l" n! Z4 [10. 33d009a8: e3a00000 mov r0, #0 ; 0x0% C5 a1 o0 R9 \; O% Z! y2 Z, y0 }; i& g
11. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}# B' E, C4 b5 u& L! [: ^
6 u& B$ b& F1 x/ N! I- w( ]12.
, ^3 d1 X! y$ U. Z- l7 H13. 33d009b0 <clock_init>:. }! u* w2 R7 V9 W3 ~7 R
4 b5 d2 n6 X; {14. 33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000+ y1 H2 a- W6 y4 F; U& c) F
$ ]. E# Y ?7 C7 ]! V2 A15. 33d009b4: e3a03005 mov r3, #5 ; 0x5 _6 C6 }1 y" x: y; H* F8 `
16. 33d009b8: e5823014 str r3, [r2, #20]4 ?) Z! L1 ]( K! Z$ F4 l
. C; n# a( u% U1 _+ k$ R: s8 x- r17. ... ...4 v. J% Y1 v# ?+ @4 P# n2 V; [
* z9 Y" Z$ Q5 \% Q8 b18. 33d009f8: e1a0f00e mov pc, lr
, w# U0 f3 A4 N
: G/ ~+ `: q0 n& R' A6 O) c(1)clock_init部分的代码
, R$ y' R+ v' i0 j' n可以看到该函数第一行:4 i; W! N1 s$ F9 F8 ?) I7 j& u3 d; ~
/ y% M- V- r% j' B% a* v8 \9 `" P$ C/ f$ X: v" c* a
1. 33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000
# S& d8 V- }. ]
" O, f4 y* B% M+ ?6 l' K1 N4 q& _- M0 {8 N, Y7 M; q* ^) z
就没有我们所期望的push指令,没有去将一些寄存器的值放到堆栈中。这是因为,我们clock_init这部分的内容,所用到的r2,r3等等寄存器,和前面调用clock_init之前所用到的寄存器r0,没有冲突,所以此处可以不用push去保存这类寄存器的值,不过有个寄存器要注意,那就是r14,即lr,其是在前面调用clock_init的时候,用的是bl指令,所以会自动把跳转时候的pc的值赋值给lr,所以也不需要push指令去将PC的值保存到堆栈中。% j. j, n2 D: J% s
* E7 I+ c. I4 D8 ?; H1 S: f% y3 m
4 q( y; d. a( |) q+ J而clock_init的代码的最后一行:9 b N% W6 U9 k7 w4 I _
( E- W6 C9 a( H# C9 R& h( z( m5 q; |* ^7 b6 c' Y% u9 U' g7 S- E5 S# X7 j- k
1. 33d009f8: e1a0f00e mov pc, lr* Q8 u! {1 c5 }, \" B; V3 u
% }) \$ [7 r+ t8 [+ \7 m B t7 W: L; o# j! _
/ ?! g4 u0 L1 D, ~8 x( U
就是我们常见的mov pc, lr,把lr的值,即之前保存的函数调用时候的PC值,赋值给现在的PC,这样就实现了函数的正确的返回,即返回到了函数调用时候下一个指令的位置。2 P8 O# [3 {% ^ u8 ~/ g( _; I; {
6 q( m$ H: E+ j% V
9 i5 P9 S" @: d# }: B& q. M" _" R Z
2 Z( h& p& @( s/ U3 L这样CPU就可以继续执行原先函数内剩下那部分的代码了。; x: b! [" s; Z+ Y7 y) F
% U8 k- e6 a/ Q' d0 A4 B0 e+ x0 Y @3 f5 x# e/ E4 S p: U, g
+ M: r4 l* Y2 J; S! n* F, O% [3 Z' C, C! T( Q7 O
(2)CopyCode2Ram部分的代码
+ b0 l7 S0 u4 P& c& |' S. Z: G' g7 F* _1 M: A, A7 u% h, z0 Q
1. 33d0091c: e92d4070 push {r4, r5, r6, lr}5 V$ G' W' T9 S
, J4 B5 F8 {8 \, y3 _
/ ~# B" ?4 B! _+ _
3 t1 g* ]( d6 ^, z3 v8 O* |- C: u就是我们所期望的,用push指令,保存了r4,r5,r以及lr。用push去保存r4,r5,r6,那是因为所谓的保存现场,以后后续函数返回时候再恢复现场,而用push去保存lr,那是因为此函数里面,还有其他函数调用:, [; E4 K! a1 S6 q% K& ]. r3 @
4 b) e( D4 X9 D W& l1 K
g& k" ]1 d; q3 O% y1. 33d0092c: ebffffef bl 33d008f0 <bBootFrmNORFlash>" v; ~$ Q) }; z" I5 `- o2 ]0 s$ `' z1 y
2. ... ...4 k6 m, ^( o3 R( E
3. 33d00984: ebffff14 bl 33d005dc <nand_read_ll>* A5 K1 ?" K$ y" r' a
. X$ r0 G# p& d5 K7 [+ R8 X" Q4. ... ...% W+ ?, d g. h( [0 B3 i: z
g. A* R) K! ^5 M+ ~/ ?7 [9 m! L4 e6 }7 a
+ Y/ W) {8 R: ~% ^6 u
也用到了bl指令,会改变我们最开始进入clock_init时候的lr的值,所以我们要用push也暂时保存起来。而对应地,CopyCode2Ram的最后一行:
! g( h, \. T4 T8 O. h5 s! [! ^7 w" i& S. t6 Z
) z' m9 o* H' }: ^9 J G3 V6 \+ _/ b2 J
1. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}6 D3 E ^" k+ j3 w d0 c2 t5 a6 \3 k
2 V- ]& T. x F9 a* V' w4 H% R- Z u. a9 m5 X+ }
) o. k$ X* k# s8 y6 I- g$ k就是把之前push的值,给pop出来,还给对应的寄存器,其中最后一个是将开始push的lr的值,pop出来给赋给PC,因为实现了函数的返回。另外,我们注意到,在CopyCode2Ram的倒数第二行是:
) |7 w' c( ]- \/ r! R! E) n; Y# q& D) A% O
+ d3 d/ D! T3 n/ `# B4 K# i* a, Q8 C- Z1 |8 I) [* n# ~
# [ s4 W5 v( m& @4 \. Z1. 33d009a8: e3a00000 mov r0, #0 ; 0x05 @/ b+ n7 J" U. B# O0 y9 j" H2 W0 c6 a
1 B# l3 h$ Q% v, p& n: p% S: b; U( r5 K! n& k
是把0赋值给r0寄存器,这个就是我们所谓返回值的传递,是通过r0寄存器的。$ _, r# J$ z6 Y- H1 t1 [9 J5 u6 t9 N5 l9 @9 [. a
9 }! N9 j. z2 c+ L9 U3 y1 m; w9 j* H6 q% y+ h
此处的返回值是0,也对应着C语言的源码中的“return 0”.+ i; z4 d! a9 L$ E' Q m3 f+ f7 K
0 d9 ^6 ]* [3 o' k) }7 U* P2 Y7 f对于使用哪个寄存器来传递返回值:
) h& ^$ U# F t# ^7 K当然你也可以用其他暂时空闲没有用到的寄存器来传递返回值,但是这些处理方式,本身是根据ARM的APCS的寄存器的使用的约定而设计的,你最好不要随便改变使用方式,最好还是按照其约定的来处理,这样程序更加符合规范。% j0 G1 N8 G. i. h) q
|
|