2011年9月30日 星期五

The Process Address Space

  • The process address space
      • abstract:
        • 系統除了管理physical memory之外, 它也會管理user-space process的記憶體, 這部份又被叫作process address space. Linux是一個virtual memory OS, process看見的記憶體都是虛擬過的, 每個process都以為擁有全部的記憶體, 而且單一process所看見的記憶體可能比physical memory還要大.
        • 要用什麼來描述一個process address space? 而且總不可能讓process access所有address吧, 那可用的memory又要用什麼來描述? 怎麼對映到physical address? 後面討論的是這些.

    一. Address space

      • Address space
        • Process address space是process可以讀取或使用的記憶體. 不同的process中, 彼此的memory address是不相關的. 也有所謂的thread, 可以共享彼此的address space.
        • 雖然32位元process可以最多指到4GB的位址, 但process沒有權限存取所有的記憶體. 一個process所能合法存取的記憶體區塊, 又稱作memory area. 透過kernel, process可以在它的address space裡動態增減memory area.
        • Memory area包含:
          • text section, a memory map of the executable file’s code.
          • data section, a memory map of the initialized global variables.
          • bss section, a memory map of the zero page containing uninitialized global variables.
          • Others.
      • Memory descriptor
        • 已經知道了process address space, 那kernel用什麼來保存它呢? 用memory descriptor: mm_struct. 這個資料結構中保存了所有process address space的資訊, 位於linux/mm_types.h底下, 其中幾個element:
          • mm_user, 指的是使用這個address space的process個數.
          • mm_count, primary reference count for the mm_struct. ex. 若有9個thread, 則mm_user=9, mm_count=1. 只有當mm_user=0, mm_count才會變0.
          • mmap 和 mm_rb 都是用來存memory area的資訊. 不同的是mmap採用linked list, mm_rb採用紅黑樹.
      • Allocating a memory descriptor
        • memory descriptor存放在task中process descriptor裡的mm欄. 因此, current->mm 就可以指到現在process的memory descriptor. 函式copy_mm用來複製parent的memory descriptor給child. 透過kernel/fork.c裡的allocate_mm()可以從mm_cache中得到一個mm_struct.
      • Destroy a memory descriptor
        • 當一個process離開, 會呼叫kernel/exit.c裡的mm_exit(), 當中會呼叫mm_put(), 用來減mm_user. 當mm_user變0, mm_drop()就會被呼叫來減mm_count. 當mm_count變0, 就會呼叫free_mm(), 透過kmem_cache_free()將mm_struct丟回mm_cache.
      • mm_struct and kernel thread
        • Kernel thread沒有process address space, 也就沒有memory descriptor, 因此kernel thread的 process descriptor 的mm欄位是NULL. Kernel thread的定義亦是: 沒有user context的process.
        • Kernel thread 沒有 address space 會有影響嗎? OK的, 因為它不會存取user-space memory. 因為 kernel thread 沒有 user-space pages, 也就不用memory descriptor 和 page tables. 但kernel thread 仍然需要page table等資料, 為了節省記憶體, 以及節省switch的時間, kernel threads 會直接使用前一個process的memory descriptor.
        • 當一個process被schedule到, 它會先load mm所指的address space, 再將active_mm指到新的address space上. 而當kernel thread被schedule到, 它看見mm是NULL則會保留原本load的address space, 然後將active_mm指到前一個process的memory descriptor. 這樣kernel thread 就能使用需要的page tables. Kernel thread只會從process address space中拿出屬於kernel memory的資訊, 並不會存取user-space memory. 而且所有process幫忙存的這個資訊是一樣的.

    二. memory area

      • Virtual memory area
        • Kernel如何描述address space中的memroy region呢? 用linux/mm_type.h中的vm_area_struct, 一般也稱作virtual memory area (VMA). 系統把每個memory area都當成一個物件. 每一個物件都有相對應的屬性與操作函式.
      • VMA flags
        • VM_READ, VM_WRITE, VM_EXEC 這三個是常見的flag, 用來指定memory area中的pages是可以read, 可以write, 或可以執行的.
      • Memory area in real life
        • 使用cat proc//maps, 可以看見process address space中的memory area. pmap指令也有一樣的功能.

    三. Page tables.

      • Page tables
        • 雖然程式都在virtual memory中執行, 但processor卻會在physical memory上直接操作, 因此當一個virtual memory address被使用, 它會先被轉成physical memory. 而這個轉換機制會透過page table來完成. Page table將virtual address分成幾個片段, 每個片段透過index指向一個table, 而table會指到另一個table或是physical page.
        • Linux中, page table分為三層. 最上面那層又叫PGD (page global directory), 由一個型態是pgd_t的array構成. 第二層是PMD (page middle directory), 由pmd_t的array構成. 第三層被簡稱page table, 由型態為pte_t的page table entry構成.
        • Page table跟架構有關, 被定義在asm/page.h
      • TLB
        • 幾乎每次操作virtual address都要透過page table來轉換, 因此效能是一個關鍵. 大部份的processor都使用TLB (translation lookaside buffer) 來加速這個過程, 它的作法即是將virtual-to-physical mapping 暫存起來. 當一個virtual address被存取, processor會先到TLB裡看有沒有hit, 若有則立即回傳physical address, 若沒有再透過page table來查physical address.

2011年9月29日 星期四

使用debug工具-CGDB

CGDB入門

GDB是一套好用的debug工具,而CGDB則是基於GDB的功能,在介面上分成了指令區和程式碼顯示區兩塊,所以CGDBGDB的用法是一樣的,更貼切地說,CGDB只是加了程式碼顯示區域的GDB

這份文件會以對在qemu上跑的Linux kerneldebug的動作為範例做說明。

1. 安裝,使用CGDB

安裝使用apt-get即可:

#apt-get install CGDB

因為我們所要debug的對象是屬於arm架構下,所以必須使用toolchain所提供的CGDB:

#cgdb –d arm-none-linux-gnueabi-gdb

2. QEMU開啟GDB mode

QEMU開機的script中,要加上-S -s的參數,這個參數會讓QEMU的控制交給GDB,下了這個參數會讓QEMU開機過程卡住,等到GDB有執行的指令才會開始動。

3. GDB連線到QEMU

debug就必須要先將GDB所在的terminal連線到QEMU所在的terminalGDB預設的port1234,在GDB裡面打入:

#target remote :1234

4. GDB載入symbol file

GDB是依據所載入的symbol file來顯示debug的相關資訊,包含程式執行到哪一行、所有register所儲存的東西、變數內容等。在我們編kernel的時候,在kernel source code所在的跟目錄下會伴隨產生vmlinux這個檔案,file是用來載入symbol file的指令,後面接著symbol file所在的路徑和檔案名稱,例如:

#file linux/vmlinux

5. 使用GDB script

先編輯一個簡單的script叫做gdbscript內容為:

target remote :1234

file linux/vmlinux

cgdb沒有提供讀script檔案的參數,但是GDB有,在CGDB指令的最後放上雙減號"--",這代表CGDB指令的結束,所以接在雙減號之後就是給GDB看的參數,我們在加上-x參數導入script:

#cgdb –d arm-none-linux-gnueabi-gdb -- -x gdbscript

這樣打開CGDB之後就會自動把port接起來並且載入symbol file了。

6. GDB指令

(1) continue

讓程式繼續跑下去,直到停在breakpoint

(2) Breakpoint

程式執行到這裡就會停下來,並且會顯示目前執行到code的哪裡

a. Add breakpoint

Breakpoint可以設定在function、程式的某一行、記憶體位址

#breakpoint schedule

#breakpoint kernel/sched.c:5430

b. Enable breakpoint

設定的breakpoint不一定就一定要生效,預設是enable的狀態,如果要把一個breakpoint enable,指令打:

#enable

breakpoint的流水號

c. Disable breakpoint

#disable

d. Clear breakpoint

清除breakpoint,後面接著行號或是function名稱

#clear test.c:1234

#clear schedule

e. Delete breakpoint

刪除breakpoint,後面接著breakpoint流水號

#delete

f. Conditional breakpoint

可以加上條件來決定某個中斷點在執行的時候要不要停下來

#condition (var > 3)

(3) next

執行下一行程式碼,但是遇到function不會進去function裡面。

(4) step

執行下一行程式碼,遇到function會進去逐行跑,所以這個指令是會把整任何程式碼徹底地跑過。

(5) list

顯示目前停下來的點是被誰呼叫的。

(6) print

印出變數內的值,可以加入/x以十六進位顯示,或是/d以十進位顯示。

#print /x var

(7) info

顯示很多有用的資訊,包含registermemory位置都可以。

#info r

(8) backtrace

可以看出使用GDB時在那些地方停下來過。

(9) disassemble

呈現出目前的組合語言程式碼

7. 指令縮寫:

指令

縮寫

backtrace

bt

breakpoint

b

condtion

cond

continue

c

diable

dis

disassemble

disas

enable

en

Info

i

list

l

next

n

print

p

step

s

GDB的縮寫原則是,只要指令的前幾個字元可以辨別出是哪個指令,就可以當縮寫,舉例:list的縮寫可以是l, li, lis, list

8. CGDB上下區域的切換

CGDB按下Escfocus到上面的顯示code區域,這個時可以按下+-來調整顯示code區域的大小,也可以Page UpPage Down來移動,按下i會回到下面才可以打指令,