2010年12月13日 星期一

組合語言轉成C語言

這是在一個不知不覺下完成的一個工作。
做完了才發覺是完成這個動作。

發生的狀況是:
Bee在做不同平台間的移植作業。
來源是68K的系統,目的系統不便明說。
為了方便移植工作順利,先移到Windows平台做模擬驗證動作。
有些和系統及作業系統相關的組合語言,因為在Windows下有另一套函式取代,所以不轉移。
有的則是使用內嵌組合語言的,因為和處理器設定有關的,則是利用條件編譯的方式跳掉。
一路修改所有組合語言相關的程式。直到最後一個...
最後一個函式是atol(),這是標準C的函式庫,但原系統就不用標準C的函式庫,而是用一個手寫函式。
問題是它是100%的組合語言,本想改寫,後來就寫成另一個樣子。

原始函式為:
long atol (const char * Str)
{
    asm ("    move.l    `Str`,a0    ; Address of String");
    asm ("    move.l    d2,-(sp)    ; Save D2");
    asm ("    moveq    #0,d0        ; Initialize sum to 0 in D0");
    asm ("    moveq.l    #0,d1");
    asm ("    moveq    #0,d2        ; Assume positive number");
    asm ("    move.l    d0,a1");
    asm ("white:");
    asm ("    move.b    (a0)+,d1    ; Get one char into D1");
    asm ("    cmpi.l    #32,d1        ; Skip leading white spaces");
    asm ("    beq    white");
    asm ("    cmpi.l    #13,d1        ; White space include HT,LF,VT,FF,CR");
    asm ("    bgt.s    sign");
    asm ("    cmpi.l    #9,d1        ; Is it >= tab ?");
    asm ("    bge    white");
    asm ("sign:");
    asm ("    cmpi.l    #43,d1        ; Is there a (+) sign ?");
    asm ("    beq.s    nextc        ; Skip to the next char");
    asm ("    cmpi.l    #45,d1        ; Is it negative ?");
    asm ("    bne.s    digit        ;   No, start to check for digits");
    asm ("    moveq    #1,d2        ; Remember the number is negative");
    asm ("nextc:");
    asm ("    move.b    (a0)+,d1    ; Get next char");
    asm ("digit:            ; Find the first non-zero digit");
    asm ("    subi.l    #48,d1        ; Integer value of this digit");
    asm ("    beq    nextc        ; Skip leading zeros");
    asm ("    bcs.s    return        ; Value is 0, return");
    asm ("    cmpi.l    #9,d1        ; Test for valid digits");
    asm ("    bgt.s    return        ; Value is 0, return");
    asm ("loop:");
    asm ("    add.l    d1,d0        ; Add value of this digit to sum");
    asm ("    move.b    (a0)+,d1    ; Next char");
    asm ("    subi.l    #48,d1        ; Integer value of this digit");
    asm ("    bcs.s    done        ; No more digits");
    asm ("    cmpi.l    #9,d1        ; Test for valid digits");
    asm ("    bgt.s    done");
    asm ("        ; multiply value in D0 by 10 using shifts and add");
    asm ("    add.l    d0,d0        ; Sum * 2");
    asm ("    move.l    d0,a1        ; Save a copy in A1");
    asm ("    lsl.l    #2,d0        ; Sum * 8");
    asm ("    add.l    a1,d0        ; Sum * 10");
    asm ("    bra    loop");
    asm ("done:");
    asm ("    tst.b    d2        ; Is the number negative ?");
    asm ("    beq.s    return");
    asm ("    neg.l    d0");
    asm ("return:");
    asm ("    move.l    (sp)+,d2    ; Restore D2");
}

改寫為
long atol (const char * Str)
{
    register char *a0=(char *)Str;
    register long  d2=0;
    register int   d0=0;
    register int   d1=0;
    register int   a1=0;
White:
    d1 = *a0++;
    if( d1 == ' ') goto White;
    if( d1 > 13  ) goto Sign;
    if( d1 >= 9  ) goto White;
Sign:
    if( d1 == 43 ) goto Nextc;
    if( d1 != 45 ) goto Digit;
    d2 = 1;
Nextc:
    d1 = *a0++;
Digit:
    d1 -= 48;
    if( d1 == 0) goto Nextc;
    if( d1 < 0 ) goto Return;
    if( d1 > 9 ) goto Return;
Loop:
    d0 += d1;
    d1 = *a0++;
    d1 -= 48;
    if( d1 < 0 ) goto Done;
    if( d1 > 9 ) goto Done;
    d0 += d0;
    a1 = d0;
    d0 = d0 << 2;
    d0 += a1;
    goto Loop;
Done:       
    if( d2 == 0 ) goto Return;
    d0 = -d0;
Return:    
    return d0;
}

這是新改函式產生出來的組合語言檔
    XDEF    _atol
    ?type    260,x,'atol',0,1,14336,20,1,259,0
    ?f_x_d    'atol',12,260
_atol:
    ?v_a_d    'Str',4,259
    ?v_l_d    'a0',0,a0,261
    ?v_l_d    'd2',0,d1,20
    ?v_l_d    'd0',0,d3,16
    ?v_l_d    'd1',0,d2,16
    ?v_l_d    'a1',0,d4,16
    ?line    21,30
    lea.l    -12(sp),sp
    movem.l    d2/d3/d4,(sp)
    moveq    #0,d0
    ?line    74,33
    movea.l    16(sp),a0
    ?line    75,23
    moveq    #0,d1
    ?line    76,23
    moveq    #0,d3
    ?line    77,23
    moveq    #0,d2
    ?line    78,23
    moveq    #0,d4
    ?line    80,14
L1:
    move.b    (a0)+,d2
    extb.l    d2
    ?line    81,17
    moveq    #32,d0
    cmp.l    d2,d0
    beq.s    L1
    ?line    82,15
    moveq    #13,d0
    cmp.l    d2,d0
    blt.s    L4
    ?line    83,15
    moveq    #9,d0
    cmp.l    d2,d0
    ble.s    L1
    ?line    85,16
L4:
    moveq    #43,d0
    cmp.l    d2,d0
    beq.s    L7
    ?line    86,16
    moveq    #45,d0
    cmp.l    d2,d0
    bne.s    L9
    ?line    87,10
    moveq    #1,d1
    ?line    89,14
L7:
    move.b    (a0)+,d2
    extb.l    d2
    ?line    91,12
L9:
    moveq    #-48,d0
    add.l    d0,d2
    ?line    92,15
    beq.s    L7
    ?line    93,14
    tst.l    d2
    bmi.s    L12
    ?line    94,14
    moveq    #9,d0
    cmp.l    d2,d0
    blt.s    L12
    ?line    96,12
L14:
    add.l    d2,d3
    ?line    97,14
    move.b    (a0)+,d2
    extb.l    d2
    ?line    98,12
    moveq    #-48,d0
    add.l    d0,d2
    ?line    99,14
    bmi.s    L16
    ?line    100,14
    moveq    #9,d0
    cmp.l    d2,d0
    blt.s    L16
    ?line    101,12
    add.l    d3,d3
    ?line    102,11
    move.l    d3,d4
    ?line    103,16
    lsl.l    #2,d3
    ?line    104,12
    add.l    d4,d3
    ?line    105,13
    bra.s    L14
    ?line    107,15
L16:
    tst.l    d1
    beq.s    L12
    ?line    108,12
    neg.l    d3
    ?line    110,13
L12:
    move.l    d3,d0
    ?line    111,1
    movem.l    (sp),d2/d3/d4
    lea.l    12(sp),sp
    rts
;     code: 124 bytes   stack: 12 bytes
    ?end
    
經比對轉出的組合語言動作符合。然後也可以在Windows系統下順利編譯。
寫完後無聊,用Google找找看有沒有組合語言轉成C語言相關的事。
所得答案是:沒有這種方法。

可是Bee完成了這樣的事!
而且在寫的過程中發現轉換的方法。
大部分組合語言可以轉成單行的C語言。
Bee不去處理程式結構的轉換,所以只要把標記(Label)直接轉成C的標記。
無條件跳越直接可以翻成 goto Label;
比較有問題的是程式控制指令。
做法很簡單,就直接轉成 if() goto Label;
唯一要處理的是if括號內的東西。
括號內的,和上一個指令有關。
上個指令是比較指令,就直接移進括號內。
上個指令不是比較指令,就將有影響的暫存器放入括號內。
一路就做完了,也沒有問題。

沒想到就這樣完成了一個網路找不到答案的問題。
只是確保可以動作,但效率不好。
可以看看翻出來的組合語言,多出了許多動作。
好在只是在Windows上模擬,先可以過再說。還有一堆的問題還要解決啊!


4 則留言:

  1. 太強了!!那這應該可以申請專利吧!!若是不行申請專利,那總該可以發表論文了吧!!
    [版主回覆12/14/2010 10:04:23]只是換個想法,而不是什麼創新。
    這個方法也沒有什麼有用之處,才會留給我想到。
    有錢賺的話早有人做了。

    回覆刪除
  2. 那更好啊!!趁這機會出本教學的書,一定會賺錢的啦!!
    [版主回覆12/14/2010 21:47:46]書難賺,版費不多。軟體出書已經很多了。
    寫部落格也一樣,賺錢忙時是不會有時間寫的。

    回覆刪除
  3. 不過既然可以轉成c語言,為何不用自己的想法寫出相同功能的c語言就好?
    [版主回覆12/16/2010 14:00:56]這只是一個阻礙轉成c語言的函式。我還有作業系統移到Windows下的問題,IO模擬問題,Flash ROM存入模擬等等一堆問題。
    等到那些都解決了,才會整理。到時再看有無時間。
    商用的軟體不會等做好了才上市,會動就出了。所以只要能正確動就行。
    在做這個動作前,我在130檔案中,已經解決了200多個warning的問題。
    因為我看不下有如此多的Warning,會阻礙我判定移植所產生的問題。
    問題真的很多,但重要的還沒全解。
    只是趁機寫篇文章,因為過了我大概也會忘了。


    回覆刪除
  4. GCC 沒有 68K的嗎
    怎麼不用 GCC 做就好了

    [版主回覆01/01/2011 17:02:56]不是沒想過,GCC編譯器也取得。但要移植組合語言及作業系統。
    但還是在68K上,個人覺得有些問題還是沒解決。
    1.作業系統特殊,如何運作仍未知。
    2.想利用Windows debugger來了解系統。
    3.先移到Windows後,直接就移到ARM去。這個才有成本優勢。死守在68K有很多限制。
    要離開68K,要先將跨平台做好。

    回覆刪除