本文詳解 Linux 內核的網路協議棧工作原理,適用於學習參考。基於版本 1.2.13 和 2.6.32,理解數據報文的封裝與分用至關重要。
數據包在傳輸過程中,首先由應用程序通過 TCP 協議發送,經過內核網路協議棧逐層處理,形成 TCP 報文段,再變為 IP 數據報,最終以幀形式通過乙太網傳輸。接收端則通過從底向上解析幀,逐層去掉協議首部,進行分用,確定接收數據的上層協議。
內核初始化流程從arch/mips/kernel/head.S開始,經過一系列初始化函數,如內存、中斷、設備等,最終調用 socket_init() 初始化協議棧,包括設備無關層的dev_init(),確保硬體層與網路協議層的銜接。
在收包流程中,硬體層接收到數據後,中斷服務子程序將數據復制到內核空間,通過netif_rx()傳遞給協議層處理。例如,TCP 數據包通過tcp_rcv()解析並匹配到正確的sock結構體,將數據包存儲到用戶空間。
發包流程涉及套接字創建和數據包發送,用戶空間通過系統調用介面與協議無關層交互,最終數據包通過協議棧傳遞到硬體層發送出去。
⑵ Linux驅動程序的工作原理
由於你的問題太長我只好轉載別人的手打的太累不好意思~~~
Linux是Unix***作系統的一種變種,在Linux下編寫驅動程序的原理和
思想完全類似於其他的Unix系統,但它dos或window環境下的驅動程序有很大的
區別.在Linux環境下設計驅動程序,思想簡潔,***作方便,功芤埠芮看?但是
支持函數少,只能依賴kernel中的函數,有些常用的***作要自己來編寫,而且調
試也不方便.本人這幾周來為實驗室自行研製的一塊多媒體卡編制了驅動程序,
獲得了一些經驗,願與Linux fans共享,有不當之處,請予指正.
以下的一些文字主要來源於khg,johnsonm的Write linux device driver,
Brennan's Guide to Inline Assembly,The Linux A-Z,還有清華BBS上的有關
device driver的一些資料. 這些資料有的已經過時,有的還有一些錯誤,我依
據自己的試驗結果進行了修正.
一. Linux device driver 的概念
系統調用是***作系統內核和應用程序之間的介面,設備驅動程序是***作系統
內核和機器硬體之間的介面.設備驅動程序為應用程序屏蔽了硬體的細節,這樣
在應用程序看來,硬體設備只是一個設備文件, 應用程序可以象***作普通文件
一樣對硬體設備進行***作.設備驅動程序是內核的一部分,它完成以下的功能:
1.對設備初始化和釋放.
2.把數據從內核傳送到硬體和從硬體讀取數據.
3.讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據.
4.檢測和處理設備出現的錯誤.
在Linux***作系統下有兩類主要的設備文件類型,一種是字元設備,另一種是
塊設備.字元設備和塊設備的主要區別是:在對字元設備發出讀/寫請求時,實際
的硬體I/O一般就緊接著發生了,塊設備則不然,它利用一塊系統內存作緩沖區,
當用戶進程對設備請求能滿足用戶的要求,就返回請求的數據,如果不能,就調用請求函數來進行實際
的I/O***作.塊設備是主要針對磁碟等慢速設備設計的,以免耗費過多的CPU時間
來等待.
已經提到,用戶進程是通過設備文件來與實際的硬體打交道.每個設備文件都
都有其文件屬性(c/b),表示是字元設備還蔤強檣璞?另外每個文件都有兩個設
備號,第一個是主設備號,標識驅動程序,第二個是從設備號,標識使用同一個
設備驅動程序的不同的硬體設備,比如有兩個軟盤,就可以用從設備號來區分
他們.設備文件的的主設備號必須與設備驅動程序在登記時申請的主設備號
一致,否則用戶進程將無法訪問到驅動程序.
最後必須提到的是,在用戶進程調用驅動程序時,系統進入核心態,這時不再是
搶先式調度.也就是說,系統必須在你的驅動程序的子函數返回後才能進行其他
的工作.如果你的驅動程序陷入死循環,不幸的是你只有重新啟動機器了,然後就
是漫長的fsck.//hehe
(請看下節,實例剖析)
讀/寫時,它首先察看緩沖區的內容,如果緩沖區的數據
如何編寫Linux***作系統下的設備驅動程序
Roy G
二.實例剖析
我們來寫一個最簡單的字元設備驅動程序.雖然它什麼也不做,但是通過它
可以了解Linux的設備驅動程序的工作原理.把下面的C代碼輸入機器,你就會
獲得一個真正的設備驅動程序.不過我的kernel是2.0.34,在低版本的kernel
上可能會出現問題,我還沒測試過.//xixi
#define __NO_VERSION__
#include
#include
char kernel_version [] = UTS_RELEASE;
這一段定義了一些版本信息,雖然用處不是很大,但也必不可少.Johnsonm說所
有的驅動程序的開頭都要包含,但我看倒是未必.
由於用戶進程是通過設備文件同硬體打交道,對設備文件的***作方式不外乎就
是一些系統調用,如 open,read,write,close...., 注意,不是fopen, fread.,
但是如何把系統調用和驅動程序關聯起來呢?這需要了解一個非常關鍵的數據
結構:
struct file_operations {
int (*seek) (struct inode * ,struct file *, off_t ,int);
int (*read) (struct inode * ,struct file *, char ,int);
int (*write) (struct inode * ,struct file *, off_t ,int);
int (*readdir) (struct inode * ,struct file *, struct dirent * ,int);
int (*select) (struct inode * ,struct file *, int ,select_table *);
int (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long
int (*mmap) (struct inode * ,struct file *, struct vm_area_struct *);
int (*open) (struct inode * ,struct file *);
int (*release) (struct inode * ,struct file *);
int (*fsync) (struct inode * ,struct file *);
int (*fasync) (struct inode * ,struct file *,int);
int (*check_media_change) (struct inode * ,struct file *);
int (*revalidate) (dev_t dev);
}
這個結構的每一個成員的名字都對應著一個系統調用.用戶進程利用系統調用
在對設備文件進行諸如read/write***作時,系統調用通過設備文件的主設備號
找到相應的設備驅動程序,然後讀取這個數據結構相應的函數指針,接著把控制
權交給該函數.這是linux的設備驅動程序工作的基本原理.既然是這樣,則編寫
設備驅動程序的主要工作就是編寫子函數,並填充file_operations的各個域.
相當簡單,不是嗎?
下面就開始寫子程序.
#include
#include
#include
#include
#include
unsigned int test_major = 0;
static int read_test(struct inode *node,struct file *file,
char *buf,int count)
{
int left;
if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT )
return -EFAULT;
for(left = count left > 0 left--)
{
__put_user(1,buf,1);
buf++;
}
return count;
}
這個函數是為read調用准備的.當調用read時,read_test()被調用,它把用戶的
緩沖區全部寫1.
buf 是read調用的一個參數.它是用戶進程空間的一個地址.但是在read_test
被調用時,系統進入核心態.所以不能使用buf這個地址,必須用__put_user(),
這是kernel提供的一個函數,用於向用戶傳送數據.另外還有很多類似功能的
函數.請參考.在向用戶空間拷貝數據之前,必須驗證buf是否可用.
這就用到函數verify_area.
static int write_tibet(struct inode *inode,struct file *file,
const char *buf,int count)
{
return count;
}
static int open_tibet(struct inode *inode,struct file *file )
{
MOD_INC_USE_COUNT;
return 0;
} static void release_tibet(struct inode *inode,struct file *file )
{
MOD_DEC_USE_COUNT;
}
這幾個函數都是空***作.實際調用發生時什麼也不做,他們僅僅為下面的結構
提供函數指針。
struct file_operations test_fops = {
NULL,
read_test,
write_test,
NULL, /* test_readdir */
NULL,
NULL, /* test_ioctl */
NULL, /* test_mmap */
open_test,
release_test, NULL, /* test_fsync */
NULL, /* test_fasync */
/* nothing more, fill with NULLs */
};
設備驅動程序的主體可以說是寫好了。現在要把驅動程序嵌入內核。驅動程序
可以按照兩種方式編譯。一種是編譯進kernel,另一種是編譯成模塊(moles),
如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能
動態的卸載,不利於調試,所以推薦使用模塊方式。
int init_mole(void)
{
int result;
result = register_chrdev(0, "test", &test_fops);
if (result < 0) {
printk(KERN_INFO "test: can't get major number ");
return result;
}
if (test_major == 0) test_major = result; /* dynamic */
return 0;
}
在用insmod命令將編譯好的模塊調入內存時,init_mole 函數被調用。在
這里,init_mole只做了一件事,就是向系統的字元設備表登記了一個字元
設備。register_chrdev需要三個參數,參數一是希望獲得的設備號,如果是
零的話,系統將選擇一個沒有被佔用的設備號返回。參數二是設備文件名,
參數三用來登記驅動程序實際執行***作的函數的指針。
如果登記成功,返回設備的主設備號,不成功,返回一個負值。
void cleanup_mole(void)
{
unregister_chrdev(test_major, "test");
}
在用rmmod卸載模塊時,cleanup_mole函數被調用,它釋放字元設備test
在系統字元設備表中佔有的表項。
一個極其簡單的字元設備可以說寫好了,文件名就叫test.c吧。
下面編譯
$ gcc -O2 -DMODULE -D__KERNEL__ -c test.c
得到文件test.o就是一個設備驅動程序。
如果設備驅動程序有多個文件,把每個文件按上面的命令行編譯,然後
ld -r file1.o file2.o -o molename.
驅動程序已經編譯好了,現在把它安裝到系統中去。
$ insmod -f test.o
如果安裝成功,在/proc/devices文件中就可以看到設備test,
並可以看到它的主設備號,。
要卸載的話,運行
$ rmmod test
下一步要創建設備文件。
mknod /dev/test c major minor
c 是指字元設備,major是主設備號,就是在/proc/devices里看到的。
用shell命令
$ cat /proc/devices | awk "\$2=="test" {print \$1}"
就可以獲得主設備號,可以把上面的命令行加入你的shell script中去。
minor是從設備號,設置成0就可以了。
我們現在可以通過設備文件來訪問我們的驅動程序。寫一個小小的測試程序。
#include
#include
#include
#include
main()
{
int testdev;
int i;
char buf[10];
testdev = open("/dev/test",O_RDWR);
if ( testdev == -1 )
{
printf("Cann't open file ");
exit(0);
}
read(testdev,buf,10);
for (i = 0; i < 10;i++)
printf("%d ",buf);
close(testdev);
}
編譯運行,看看是不是列印出全1 ?
以上只是一個簡單的演示。真正實用的驅動程序要復雜的多,要處理如中斷,
DMA,I/O port等問題。這些才是真正的難點。請看下節,實際情況的處理。
如何編寫Linux***作系統下的設備驅動程序
Roy G
三 設備驅動程序中的一些具體問題。
1. I/O Port.
和硬體打交道離不開I/O Port,老的ISA設備經常是佔用實際的I/O埠,
在linux下,***作系統沒有對I/O口屏蔽,也就是說,任何驅動程序都可以
對任意的I/O口***作,這樣就很容易引起混亂。每個驅動程序應該自己避免
誤用埠。
有兩個重要的kernel函數可以保證驅動程序做到這一點。
1)check_region(int io_port, int off_set)
這個函數察看系統的I/O表,看是否有別的驅動程序佔用某一段I/O口。
參數1:io埠的基地址,
參數2:io埠佔用的范圍。
返回值:0 沒有佔用, 非0,已經被佔用。
2)request_region(int io_port, int off_set,char *devname)
如果這段I/O埠沒有被佔用,在我們的驅動程序中就可以使用它。在使用
之前,必須向系統登記,以防止被其他程序佔用。登記後,在/proc/ioports
文件中可以看到你登記的io口。
參數1:io埠的基地址。
參數2:io埠佔用的范圍。
參數3:使用這段io地址的設備名。
在對I/O口登記後,就可以放心地用inb(), outb()之類的函來訪問了。
在一些pci設備中,I/O埠被映射到一段內存中去,要訪問這些埠就相當
於訪問一段內存。經常性的,我們要獲得一塊內存的物理地址。在dos環境下,
(之所以不說是dos***作系統是因為我認為DOS根本就不是一個***作系統,它實
在是太簡單,太不安全了)只要用段:偏移就可以了。在window95中,95ddk
提供了一個vmm 調用 _MapLinearToPhys,用以把線性地址轉化為物理地址。但
在Linux中是怎樣做的呢?
2 內存***作
在設備驅動程序中動態開辟內存,不是用malloc,而是kmalloc,或者用
get_free_pages直接申請頁。釋放內存用的是kfree,或free_pages. 請注意,
kmalloc等函數返回的是物理地址!而malloc等返回的是線性地址!關於
kmalloc返回的是物理地址這一點本人有點不太明白:既然從線性地址到物理
地址的轉換是由386cpu硬體完成的,那樣匯編指令的***作數應該是線性地址,
驅動程序同樣也不能直接使用物理地址而是線性地址。但是事實上kmalloc
返回的確實是物理地址,而且也可以直接通過它訪問實際的RAM,我想這樣可
以由兩種解釋,一種是在核心態禁止分頁,但是這好像不太現實;另一種是
linux的頁目錄和頁表項設計得正好使得物理地址等同於線性地址。我的想法
不知對不對,還請高手指教。
言歸正傳,要注意kmalloc最大隻能開辟128k-16,16個位元組是被頁描述符
結構佔用了。kmalloc用法參見khg.
內存映射的I/O口,寄存器或者是硬體設備的RAM(如顯存)一般佔用F0000000
以上的地址空間。在驅動程序中不能直接訪問,要通過kernel函數vremap獲得
重新映射以後的地址。
另外,很多硬體需要一塊比較大的連續內存用作DMA傳送。這塊內存需要一直
駐留在內存,不能被交換到文件中去。但是kmalloc最多隻能開辟128k的內存。
這可以通過犧牲一些系統內存的方法來解決。
具體做法是:比如說你的機器由32M的內存,在lilo.conf的啟動參數中加上
mem=30M,這樣linux就認為你的機器只有30M的內存,剩下的2M內存在vremap
之後就可以為DMA所用了。
請記住,用vremap映射後的內存,不用時應用unremap釋放,否則會浪費頁表。
3 中斷處理
同處理I/O埠一樣,要使用一個中斷,必須先向系統登記。
int request_irq(unsigned int irq ,
void(*handle)(int,void *,struct pt_regs *),
unsigned int long flags,
const char *device);
irq: 是要申請的中斷。
handle:中斷處理函數指針。
flags:SA_INTERRUPT 請求一個快速中斷,0 正常中斷。
device:設備名。
如果登記成功,返回0,這時在/proc/interrupts文件中可以看你請求的
中斷。
4一些常見的問題。
對硬體***作,有時時序很重要。但是如果用C語言寫一些低級的硬體***作
的話,gcc往往會對你的程序進行優化,這樣時序就錯掉了。如果用匯編寫呢,
gcc同樣會對匯編代碼進行優化,除非你用volatile關鍵字修飾。最保險的
辦法是禁止優化。這當然只能對一部分你自己編寫的代碼。如果對所有的代碼
都不優化,你會發現驅動程序根本無法裝載。這是因為在編譯驅動程序時要
用到gcc的一些擴展特性,而這些擴展特性必須在加了優化選項之後才能體現
出來。
關於kernel的調試工具,我現在還沒有發現有合適的。有誰知道請告訴我,
不勝感激。我一直都在printk列印調試信息,倒也還湊合。
關於設備驅動程序還有很多內容,如等待/喚醒機制,塊設備的編寫等。
我還不是很明白,不敢亂說。
⑶ linux驅動程序結構框架及工作原理分別是什麼
一、Linux device driver 的概念x0dx0ax0dx0a系統調用是操作系統內核和應用程序之間的介面,設備驅動程序是操作系統內核和機器硬體之間的介面。設備驅動程序為應用程序屏蔽了硬體的細節,這樣在應用程序看來,硬體設備只是一個設備文件,應用程序可以象操作普通文件一樣對硬體設備進行操作。設備驅動程序是內核的一部分,它完成以下的功能:x0dx0ax0dx0a1、對設備初始化和釋放;x0dx0ax0dx0a2、把數據從內核傳送到硬體和從硬體讀取數據;x0dx0ax0dx0a3、讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據;x0dx0ax0dx0a4、檢測和處理設備出現的錯誤。x0dx0ax0dx0a在Linux操作系統下有三類主要的設備文件類型,一是字元設備,二是塊設備,三是網路設備。字元設備和塊設備的主要區別是:在對字元設備發出讀/寫請求時,實際的硬體I/O一般就緊接著發生了,塊設備則不然,它利用一塊系統內存作緩沖區,當用戶進程對設備請求能滿足用戶的要求,就返回請求的數據,如果不能,就調用請求函數來進行實際的I/O操作。塊設備是主要針對磁碟等慢速設備設計的,以免耗費過多的CPU時間來等待。x0dx0ax0dx0a已經提到,用戶進程是通過設備文件來與實際的硬體打交道。每個設備文件都都有其文件屬性(c/b),表示是字元設備還是塊設備?另外每個文件都有兩個設備號,第一個是主設備號,標識驅動程序,第二個是從設備號,標識使用同一個設備驅動程序的不同的硬體設備,比如有兩個軟盤,就可以用從設備號來區分他們。設備文件的的主設備號必須與設備驅動程序在登記時申請的主設備號一致,否則用戶進程將無法訪問到驅動程序。x0dx0ax0dx0a最後必須提到的是,在用戶進程調用驅動程序時,系統進入核心態,這時不再是搶先式調度。也就是說,系統必須在你的驅動程序的子函數返回後才能進行其他的工作。如果你的驅動程序陷入死循環,不幸的是你只有重新啟動機器了,然後就是漫長的fsck。x0dx0ax0dx0a二、實例剖析x0dx0ax0dx0a我們來寫一個最簡單的字元設備驅動程序。雖然它什麼也不做,但是通過它可以了解Linux的設備驅動程序的工作原理。把下面的C代碼輸入機器,你就會獲得一個真正的設備驅動程序。x0dx0ax0dx0a由於用戶進程是通過設備文件同硬體打交道,對設備文件的操作方式不外乎就是一些系統調用,如 open,read,write,close?, 注意,不是fopen, fread,但是如何把系統調用和驅動程序關聯起來呢?這需要了解一個非常關鍵的數據結構:x0dx0ax0dx0aSTruct file_operatiONs {x0dx0ax0dx0aint (*seek) (struct inode * ,struct file *, off_t ,int);x0dx0ax0dx0aint (*read) (struct inode * ,struct file *, char ,int);x0dx0ax0dx0aint (*write) (struct inode * ,struct file *, off_t ,int);x0dx0ax0dx0aint (*readdir) (struct inode * ,struct file *, struct dirent * ,int);x0dx0ax0dx0aint (*select) (struct inode * ,struct file *, int ,select_table *);x0dx0ax0dx0aint (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long);x0dx0ax0dx0aint (*mmap) (struct inode * ,struct file *, struct vm_area_struct *);x0dx0ax0dx0aint (*open) (struct inode * ,struct file *);x0dx0ax0dx0aint (*release) (struct inode * ,struct file *);x0dx0ax0dx0aint (*fsync) (struct inode * ,struct file *);x0dx0ax0dx0aint (*fasync) (struct inode * ,struct file *,int);x0dx0ax0dx0aint (*check_media_change) (struct inode * ,struct file *);x0dx0ax0dx0aint (*revalidate) (dev_t dev);x0dx0ax0dx0a}x0dx0ax0dx0a這個結構的每一個成員的名字都對應著一個系統調用。用戶進程利用系統調用在對設備文件進行諸如read/write操作時,系統調用通過設備文件的主設備號找到相應的設備驅動程序,然後讀取這個數據結構相應的函數指針,接著把控制權交給該函數。這是linux的設備驅動程序工作的基本原理。既然是這樣,則編寫設備驅動程序的主要工作就是編寫子函數,並填充file_operations的各個域。x0dx0ax0dx0a下面就開始寫子程序。x0dx0ax0dx0a#include