這是在一個不知不覺下完成的一個工作。
做完了才發覺是完成這個動作。
發生的狀況是:
Bee在做不同平台間的移植作業。
來源是68K的系統,目的系統不便明說。
為了方便移植工作順利,先移到Windows平台做模擬驗證動作。
有些和系統及作業系統相關的組合語言,因為在Windows下有另一套函式取代,所以不轉移。
有的則是使用內嵌組合語言的,因為和處理器設定有關的,則是利用條件編譯的方式跳掉。
一路修改所有組合語言相關的程式。直到最後一個...
最後一個函式是atol(),這是標準C的函式庫,但原系統就不用標準C的函式庫,而是用一個手寫函式。
問題是它是100%的組合語言,本想改寫,後來就寫成另一個樣子。
原始函式為:
long atol (const char * Str)
{
asm (" move.l `Str`,a0 ; Address of String");
asm (" move.l d2,-(sp) ; Save D2");
asm (" moveq #0,d0 ; Initialize sum to 0 in D0");
asm (" moveq.l #0,d1");
asm (" moveq #0,d2 ; Assume positive number");
asm (" move.l d0,a1");
asm ("white:");
asm (" move.b (a0)+,d1 ; Get one char into D1");
asm (" cmpi.l #32,d1 ; Skip leading white spaces");
asm (" beq white");
asm (" cmpi.l #13,d1 ; White space include HT,LF,VT,FF,CR");
asm (" bgt.s sign");
asm (" cmpi.l #9,d1 ; Is it >= tab ?");
asm (" bge white");
asm ("sign:");
asm (" cmpi.l #43,d1 ; Is there a (+) sign ?");
asm (" beq.s nextc ; Skip to the next char");
asm (" cmpi.l #45,d1 ; Is it negative ?");
asm (" bne.s digit ; No, start to check for digits");
asm (" moveq #1,d2 ; Remember the number is negative");
asm ("nextc:");
asm (" move.b (a0)+,d1 ; Get next char");
asm ("digit: ; Find the first non-zero digit");
asm (" subi.l #48,d1 ; Integer value of this digit");
asm (" beq nextc ; Skip leading zeros");
asm (" bcs.s return ; Value is 0, return");
asm (" cmpi.l #9,d1 ; Test for valid digits");
asm (" bgt.s return ; Value is 0, return");
asm ("loop:");
asm (" add.l d1,d0 ; Add value of this digit to sum");
asm (" move.b (a0)+,d1 ; Next char");
asm (" subi.l #48,d1 ; Integer value of this digit");
asm (" bcs.s done ; No more digits");
asm (" cmpi.l #9,d1 ; Test for valid digits");
asm (" bgt.s done");
asm (" ; multiply value in D0 by 10 using shifts and add");
asm (" add.l d0,d0 ; Sum * 2");
asm (" move.l d0,a1 ; Save a copy in A1");
asm (" lsl.l #2,d0 ; Sum * 8");
asm (" add.l a1,d0 ; Sum * 10");
asm (" bra loop");
asm ("done:");
asm (" tst.b d2 ; Is the number negative ?");
asm (" beq.s return");
asm (" neg.l d0");
asm ("return:");
asm (" move.l (sp)+,d2 ; Restore D2");
}
改寫為
long atol (const char * Str)
{
register char *a0=(char *)Str;
register long d2=0;
register int d0=0;
register int d1=0;
register int a1=0;
White:
d1 = *a0++;
if( d1 == ' ') goto White;
if( d1 > 13 ) goto Sign;
if( d1 >= 9 ) goto White;
Sign:
if( d1 == 43 ) goto Nextc;
if( d1 != 45 ) goto Digit;
d2 = 1;
Nextc:
d1 = *a0++;
Digit:
d1 -= 48;
if( d1 == 0) goto Nextc;
if( d1 < 0 ) goto Return;
if( d1 > 9 ) goto Return;
Loop:
d0 += d1;
d1 = *a0++;
d1 -= 48;
if( d1 < 0 ) goto Done;
if( d1 > 9 ) goto Done;
d0 += d0;
a1 = d0;
d0 = d0 << 2;
d0 += a1;
goto Loop;
Done:
if( d2 == 0 ) goto Return;
d0 = -d0;
Return:
return d0;
}
這是新改函式產生出來的組合語言檔
XDEF _atol
?type 260,x,'atol',0,1,14336,20,1,259,0
?f_x_d 'atol',12,260
_atol:
?v_a_d 'Str',4,259
?v_l_d 'a0',0,a0,261
?v_l_d 'd2',0,d1,20
?v_l_d 'd0',0,d3,16
?v_l_d 'd1',0,d2,16
?v_l_d 'a1',0,d4,16
?line 21,30
lea.l -12(sp),sp
movem.l d2/d3/d4,(sp)
moveq #0,d0
?line 74,33
movea.l 16(sp),a0
?line 75,23
moveq #0,d1
?line 76,23
moveq #0,d3
?line 77,23
moveq #0,d2
?line 78,23
moveq #0,d4
?line 80,14
L1:
move.b (a0)+,d2
extb.l d2
?line 81,17
moveq #32,d0
cmp.l d2,d0
beq.s L1
?line 82,15
moveq #13,d0
cmp.l d2,d0
blt.s L4
?line 83,15
moveq #9,d0
cmp.l d2,d0
ble.s L1
?line 85,16
L4:
moveq #43,d0
cmp.l d2,d0
beq.s L7
?line 86,16
moveq #45,d0
cmp.l d2,d0
bne.s L9
?line 87,10
moveq #1,d1
?line 89,14
L7:
move.b (a0)+,d2
extb.l d2
?line 91,12
L9:
moveq #-48,d0
add.l d0,d2
?line 92,15
beq.s L7
?line 93,14
tst.l d2
bmi.s L12
?line 94,14
moveq #9,d0
cmp.l d2,d0
blt.s L12
?line 96,12
L14:
add.l d2,d3
?line 97,14
move.b (a0)+,d2
extb.l d2
?line 98,12
moveq #-48,d0
add.l d0,d2
?line 99,14
bmi.s L16
?line 100,14
moveq #9,d0
cmp.l d2,d0
blt.s L16
?line 101,12
add.l d3,d3
?line 102,11
move.l d3,d4
?line 103,16
lsl.l #2,d3
?line 104,12
add.l d4,d3
?line 105,13
bra.s L14
?line 107,15
L16:
tst.l d1
beq.s L12
?line 108,12
neg.l d3
?line 110,13
L12:
move.l d3,d0
?line 111,1
movem.l (sp),d2/d3/d4
lea.l 12(sp),sp
rts
; code: 124 bytes stack: 12 bytes
?end
經比對轉出的組合語言動作符合。然後也可以在Windows系統下順利編譯。
寫完後無聊,用Google找找看有沒有組合語言轉成C語言相關的事。
所得答案是:沒有這種方法。
可是Bee完成了這樣的事!
而且在寫的過程中發現轉換的方法。
大部分組合語言可以轉成單行的C語言。
Bee不去處理程式結構的轉換,所以只要把標記(Label)直接轉成C的標記。
無條件跳越直接可以翻成 goto Label;
比較有問題的是程式控制指令。
做法很簡單,就直接轉成 if() goto Label;
唯一要處理的是if括號內的東西。
括號內的,和上一個指令有關。
上個指令是比較指令,就直接移進括號內。
上個指令不是比較指令,就將有影響的暫存器放入括號內。
一路就做完了,也沒有問題。
沒想到就這樣完成了一個網路找不到答案的問題。
只是確保可以動作,但效率不好。
可以看看翻出來的組合語言,多出了許多動作。
好在只是在Windows上模擬,先可以過再說。還有一堆的問題還要解決啊!
2010年12月13日 星期一
2010年12月1日 星期三
OpenCV2.1+CUDA 64位元整合:結果失敗
最近Bee換筆記電腦是具有GeForce GT 420M的顯示卡。
現在都是安裝Windows 7 x64的版本。故Bee下載CUDA 64位元回來安裝。
到這裡都沒有問題。只有CUDA 64部分設定要自己手工調整。
之後有許多工具都很不習慣,花了不少時間去找。整個Windows和XP實在差太多了。
另外有一些其他奇怪的地方有些程式找不到裝置,原來還有UAC的問題。
好吧!看在64位元可以不受4GB限制,還是去適應好了 。
弄了數週,才想到回來看看CUDA程式。
結果,CUDA 64無法和Win32的OpenCV做Link。
而OpenCV沒有64位元的Library。那只好自己編函式庫了。
奇怪的是OpenCV2.1明明就有寫支援64位元,但一直編不出可以用的函式庫。
查過在其他平台都是可以用的。但在VS2008及VS2010就有問題。
沒錯!就是這個問題。但....沒有人解成功。
Bee又安裝了好幾次,沒一次成。查了很久,發現是沒有載入該有的函式庫。
為何!M$的C++老是玩這種,每次編出來的程式都很難搬。
最後沒辦法,回去Win32。安裝CUDA 32然後Link OpenCV,就過了。
再等OpenCV下一版再看看。
不過64位元整合算是失敗了。看來時代還沒有到。
還有很多應用軟體也都是在Win32模式下,沒有幾套是64位元。
要換到64位元,看來還是不容易取得優勢。反而是環境大改,真是不習慣。
現在都是安裝Windows 7 x64的版本。故Bee下載CUDA 64位元回來安裝。
到這裡都沒有問題。只有CUDA 64部分設定要自己手工調整。
之後有許多工具都很不習慣,花了不少時間去找。整個Windows和XP實在差太多了。
另外有一些其他奇怪的地方有些程式找不到裝置,原來還有UAC的問題。
好吧!看在64位元可以不受4GB限制,還是去適應好了 。
弄了數週,才想到回來看看CUDA程式。
結果,CUDA 64無法和Win32的OpenCV做Link。
而OpenCV沒有64位元的Library。那只好自己編函式庫了。
奇怪的是OpenCV2.1明明就有寫支援64位元,但一直編不出可以用的函式庫。
查過在其他平台都是可以用的。但在VS2008及VS2010就有問題。
沒錯!就是這個問題。但....沒有人解成功。
Bee又安裝了好幾次,沒一次成。查了很久,發現是沒有載入該有的函式庫。
為何!M$的C++老是玩這種,每次編出來的程式都很難搬。
最後沒辦法,回去Win32。安裝CUDA 32然後Link OpenCV,就過了。
再等OpenCV下一版再看看。
不過64位元整合算是失敗了。看來時代還沒有到。
還有很多應用軟體也都是在Win32模式下,沒有幾套是64位元。
要換到64位元,看來還是不容易取得優勢。反而是環境大改,真是不習慣。
訂閱:
文章 (Atom)