首先, 我會說不保證你在使用者模式 (user-mode) 中執(zhí)行的行程 (process) 能夠精確地控制時序因為 Linux 是個多工的作業(yè)環(huán)境. 你在執(zhí)行中的行程 (process) 隨時會因為各種原因被暫停大約 10 毫秒到數(shù)秒 (在系統(tǒng)負荷非常高的時候). 然而, 對於大多數(shù)使用 I/O 埠的應(yīng)用而言, 這個延遲時間實際上算不了什麼. 要縮短延遲時間, 你得使用函式 nice 將你在執(zhí)行中的行程 (process ) 設(shè)定成高優(yōu)先權(quán)(請參考 nice(2) 使用說明文件) 或使用即時排程法 (real-time scheduling) (請看下面).
如果你想獲得比在一般使用者模式 (user-mode) 中執(zhí)行的行程 (process) 還要精確的時序, 有一些方法可以讓你在使用者模式 (user-mode) 中做到 `即時' 排程的支援. Linux 2.x 版本的核心中有軟體方式的即時排程支援; 詳細的說明請參考 sched_setscheduler(2) 使用說明文件. 有一個特殊的核心支援硬體的即時排程;
(Sleeping) : sleep() 與 usleep()
現(xiàn)在, 讓我們開始較簡單的時序函式呼叫. 想要延遲數(shù)秒的時間, 最佳的方法大概 是使用函式 sleep() . 想要延遲至少數(shù)十毫秒的時間 (10 ms 似乎已是最短的 延遲時間了), 函式 usleep() 應(yīng)該可以使用. 這些函式是讓出 CPU 的使用權(quán) 給其他想要執(zhí)行的行程 (processes) (``自己休息去了''), 所以沒有浪費掉 CPU 的時間. 細節(jié)請參考 sleep(3) 與 usleep(3) 的說明文件.
如果讓出 CPU 的使用權(quán)因而使得時間延遲了大約 50 毫秒 (這取決於處理器與機器的速度, 以及系統(tǒng)的負荷), 就浪費掉 CPU 太多的時間, 因為 Linux 的排程器 (scheduler) (單就 x86 架構(gòu)而言) 在將控制權(quán)發(fā)還給你的行程 (process) 之前通常至少要花費 10-30 毫秒的時間. 因此, 短時間的延遲, 使用函式 usleep(3) 所得到的延遲結(jié)果通常會大於你在參數(shù)所指定的值, 大約至少有 10 ms.
nanosleep()
在 Linux 2.0.x 一系列的核心發(fā)行版本中, 有一個新的系統(tǒng)呼叫 (system call), nanosleep() (請參考 nanosleep(2) 的說明文件), 他讓你能夠 休息或延遲一個短的時間 (數(shù)微秒或更多).
如果延遲的時間 <= 2 ms, 若(且唯若)你執(zhí)行中的行程 (process) 設(shè)定了軟體的即時 排程 (就是使用函式 tt/sched_setscheduler()/), 呼叫函式 nanosleep() 時 不是使用一個忙碌回圈來延遲時間; 就是會像函式 usleep() 一樣讓出 CPU 的使用權(quán)休息去了.
這個忙碌回圈使用函式 udelay() (一個驅(qū)動程式常會用到的核心內(nèi)部的函式) 來達成, 并且使用 BogoMips 值 (BogoMips 可以準確量測這類忙碌回圈的速度) 來計算回圈延遲的時間長度. 其如何動作的細節(jié)請參考 /usr/include/asm/delay.h).
使用 I/O 埠來延遲時間
另一個延遲數(shù)微秒的方法是使用 I/O 埠. 就是從埠位址 0x80 輸入或輸出任何 byte 的資料 (請參考前面) 等待的時間應(yīng)該幾乎只要 1 微秒這要看你的處理器的型別與速度. 如果要延遲數(shù)微秒的時間你可以將這個動作多做幾次. 在任何標準的機器上輸出資料到該 埠位址應(yīng)該不會有不良的後果□對 (而且有些核心的設(shè)備驅(qū)動程式也在使用他). {in|out}[bw]_p() 等函式就是使用這個方法來產(chǎn)生時間延遲的 (請參考檔案 asm/io.h).
實際上, 一個使用到埠位址□圍為 0-0x3ff 的 I/O 埠指令幾乎只要 1 微秒的時間, 所以如果你要如此做, 例如, 直接使用并列埠, 只要加上幾個 inb() 函式從該 埠位址□圍讀入 byte 的資料即可.
使用組合語言來延遲時間
如果你知道執(zhí)行程式所在機器的處理器型別與時鐘速度, 你可以執(zhí)行某些組合語言指令以便獲得較短的延遲時間 (但是記住, 你在執(zhí)行中的行程 (process) 隨時會被暫停, 所以有時延遲的時間會比實際長). 如下面的表格所示, 內(nèi)部處理器的速度決定了所要使用的時鐘周期數(shù); 如, 一個 50 MHz 的處理器 (486DX-50 或 486DX2-50), 一個時鐘周期要花費 1/50000000 秒 (=200 奈秒).
指令 i386 時鐘周期數(shù) i486 時鐘周期數(shù)nop 3 1xchg %ax,%ax 3 3or %ax,%ax 2 1mov %ax,%ax 2 1add %ax,0 2 1
(對不起, 我不知道 Pentiums 的資料, 或許與 i486 接近吧. 我無法在 i386 的資料上找到只花費一個時鐘周期的指令. 如果能夠就請使用花費一個時鐘周期的指令, 要不然就使用管線技術(shù)的新式處理器也是可以縮短時間的.)
上面的表格中指令 nop 與 xchg 應(yīng)該不會有不良的後果. 指令最後可能會 改變旗號暫存器的內(nèi)容, 但是這沒關(guān)系因為 gcc 會處理. 指令 nop 是個好的選擇.
想要在你的程式中使用到這些指令, 你得使用 asm("instruction"). 指令的語法就如同上面表格的用法; 如果你想要在單一的 asm() 敘述中使用多個指令, 可以使用分號將他們隔開. 例如, asm("nop ; nop ; nop ; nop") 會執(zhí)行四個 nop 指令, 在 i486 或 Pentium 處理器中會延遲四個時鐘周期 (或是 i386 會延遲 12 個時鐘周期).
gcc 會將 asm() 翻譯成單行組合語言程式碼, 所以不會有呼叫函式的負荷.
在 Intel x86 架構(gòu)中不可能有比一個時鐘周期還短的時間延遲.
在 Pentiums 處理器上使用函式 rdtsc
對於 Pentiums 處理器而言, 你可以使用下面的 C 語言程式碼來取得自從上次重新開機 到現(xiàn)在經(jīng)過了多少個時鐘周期:
--------------------------------------------------------------------------------
extern __inline__ unsigned long long int rdtsc() { unsigned long long int x; __asm__ volatile (".byte 0x0f, 0x31" : "=A" (x)); return x; }
--------------------------------------------------------------------------------
你可以詢問參考此值以便延遲你想要的時鐘周期數(shù).
想要時間精確到一秒鐘, 使用函式 time() 或許是最簡單的方法. 想要時間更精確, 函式 gettimeofday() 大約可以精確到微秒 (但是如前所述會受到 CPU 排程的影響). 至於 Pentiums 處理器, 使用上面的程式碼片斷就可以精確到一個時鐘周期.
如果你要你執(zhí)行中的行程 (process) 在一段時間到了之後能夠被通知 (get a signal), 你得使用函式 setitimer() 或 alarm() . 細節(jié)請參考函式的使用說明文件.