| .. include:: ../disclaimer-ita.rst |
| |
| .. note:: Per leggere la documentazione originale in inglese: |
| :ref:`Documentation/kernel-hacking/hacking.rst <kernel_hacking_hack>` |
| |
| :Original: :ref:`Documentation/kernel-hacking/hacking.rst <kernel_hacking_hack>` |
| :Translator: Federico Vaga <federico.vaga@vaga.pv.it> |
| |
| .. _it_kernel_hacking_hack: |
| |
| ================================================= |
| L'inaffidabile guida all'hacking del kernel Linux |
| ================================================= |
| |
| :Author: Rusty Russell |
| |
| Introduzione |
| ============ |
| |
| Benvenuto, gentile lettore, alla notevole ed inaffidabile guida all'hacking |
| del kernel Linux ad opera di Rusty. Questo documento descrive le procedure |
| più usate ed i concetti necessari per scrivere codice per il kernel: lo scopo |
| è di fornire ai programmatori C più esperti un manuale di base per sviluppo. |
| Eviterò dettagli implementativi: per questo abbiamo il codice, |
| ed ignorerò intere parti di alcune procedure. |
| |
| Prima di leggere questa guida, sappiate che non ho mai voluto scriverla, |
| essendo esageratamente sotto qualificato, ma ho sempre voluto leggere |
| qualcosa di simile, e quindi questa era l'unica via. Spero che possa |
| crescere e diventare un compendio di buone pratiche, punti di partenza |
| e generiche informazioni. |
| |
| Gli attori |
| ========== |
| |
| In qualsiasi momento ognuna delle CPU di un sistema può essere: |
| |
| - non associata ad alcun processo, servendo un'interruzione hardware; |
| |
| - non associata ad alcun processo, servendo un softirq o tasklet; |
| |
| - in esecuzione nello spazio kernel, associata ad un processo |
| (contesto utente); |
| |
| - in esecuzione di un processo nello spazio utente; |
| |
| Esiste un ordine fra questi casi. Gli ultimi due possono avvicendarsi (preempt) |
| l'un l'altro, ma a parte questo esiste una gerarchia rigida: ognuno di questi |
| può avvicendarsi solo ad uno di quelli sottostanti. Per esempio, mentre un |
| softirq è in esecuzione su d'una CPU, nessun altro softirq può avvicendarsi |
| nell'esecuzione, ma un'interruzione hardware può. Ciò nonostante, le altre CPU |
| del sistema operano indipendentemente. |
| |
| Più avanti vedremo alcuni modi in cui dal contesto utente è possibile bloccare |
| le interruzioni, così da impedirne davvero il diritto di prelazione. |
| |
| Contesto utente |
| --------------- |
| |
| Ci si trova nel contesto utente quando si arriva da una chiamata di sistema |
| od altre eccezioni: come nello spazio utente, altre procedure più importanti, |
| o le interruzioni, possono far valere il proprio diritto di prelazione sul |
| vostro processo. Potete sospendere l'esecuzione chiamando :c:func:`schedule()`. |
| |
| .. note:: |
| |
| Si è sempre in contesto utente quando un modulo viene caricato o rimosso, |
| e durante le operazioni nello strato dei dispositivi a blocchi |
| (*block layer*). |
| |
| Nel contesto utente, il puntatore ``current`` (il quale indica il processo al |
| momento in esecuzione) è valido, e :c:func:`in_interrupt()` |
| (``include/linux/preempt.h``) è falsa. |
| |
| .. warning:: |
| |
| Attenzione che se avete la prelazione o i softirq disabilitati (vedere |
| di seguito), :c:func:`in_interrupt()` ritornerà un falso positivo. |
| |
| Interruzioni hardware (Hard IRQs) |
| --------------------------------- |
| |
| Temporizzatori, schede di rete e tastiere sono esempi di vero hardware |
| che possono produrre interruzioni in un qualsiasi momento. Il kernel esegue |
| i gestori d'interruzione che prestano un servizio all'hardware. Il kernel |
| garantisce che questi gestori non vengano mai interrotti: se una stessa |
| interruzione arriva, questa verrà accodata (o scartata). |
| Dato che durante la loro esecuzione le interruzioni vengono disabilitate, |
| i gestori d'interruzioni devono essere veloci: spesso si limitano |
| esclusivamente a notificare la presa in carico dell'interruzione, |
| programmare una 'interruzione software' per l'esecuzione e quindi terminare. |
| |
| Potete dire d'essere in una interruzione hardware perché :c:func:`in_irq()` |
| ritorna vero. |
| |
| .. warning:: |
| |
| Attenzione, questa ritornerà un falso positivo se le interruzioni |
| sono disabilitate (vedere di seguito). |
| |
| Contesto d'interruzione software: softirq e tasklet |
| --------------------------------------------------- |
| |
| Quando una chiamata di sistema sta per tornare allo spazio utente, |
| oppure un gestore d'interruzioni termina, qualsiasi 'interruzione software' |
| marcata come pendente (solitamente da un'interruzione hardware) viene |
| eseguita (``kernel/softirq.c``). |
| |
| La maggior parte del lavoro utile alla gestione di un'interruzione avviene qui. |
| All'inizio della transizione ai sistemi multiprocessore, c'erano solo i |
| cosiddetti 'bottom half' (BH), i quali non traevano alcun vantaggio da questi |
| sistemi. Non appena abbandonammo i computer raffazzonati con fiammiferi e |
| cicche, abbandonammo anche questa limitazione e migrammo alle interruzioni |
| software 'softirqs'. |
| |
| Il file ``include/linux/interrupt.h`` elenca i differenti tipi di 'softirq'. |
| Un tipo di softirq molto importante è il timer (``include/linux/timer.h``): |
| potete programmarlo per far si che esegua funzioni dopo un determinato |
| periodo di tempo. |
| |
| Dato che i softirq possono essere eseguiti simultaneamente su più di un |
| processore, spesso diventa estenuante l'averci a che fare. Per questa ragione, |
| i tasklet (``include/linux/interrupt.h``) vengo usati più di frequente: |
| possono essere registrati dinamicamente (il che significa che potete averne |
| quanti ne volete), e garantiscono che un qualsiasi tasklet verrà eseguito |
| solo su un processore alla volta, sebbene diversi tasklet possono essere |
| eseguiti simultaneamente. |
| |
| .. warning:: |
| |
| Il nome 'tasklet' è ingannevole: non hanno niente a che fare |
| con i 'processi' ('tasks'), e probabilmente hanno più a che vedere |
| con qualche pessima vodka che Alexey Kuznetsov si fece a quel tempo. |
| |
| Potete determinate se siete in un softirq (o tasklet) utilizzando la |
| macro :c:func:`in_softirq()` (``include/linux/preempt.h``). |
| |
| .. warning:: |
| |
| State attenti che questa macro ritornerà un falso positivo |
| se :ref:`botton half lock <it_local_bh_disable>` è bloccato. |
| |
| Alcune regole basilari |
| ====================== |
| |
| Nessuna protezione della memoria |
| Se corrompete la memoria, che sia in contesto utente o d'interruzione, |
| la macchina si pianterà. Siete sicuri che quello che volete fare |
| non possa essere fatto nello spazio utente? |
| |
| Nessun numero in virgola mobile o MMX |
| Il contesto della FPU non è salvato; anche se siete in contesto utente |
| lo stato dell'FPU probabilmente non corrisponde a quello del processo |
| corrente: vi incasinerete con lo stato di qualche altro processo. Se |
| volete davvero usare la virgola mobile, allora dovrete salvare e recuperare |
| lo stato dell'FPU (ed evitare cambi di contesto). Generalmente è una |
| cattiva idea; usate l'aritmetica a virgola fissa. |
| |
| Un limite rigido dello stack |
| A seconda della configurazione del kernel lo stack è fra 3K e 6K per la |
| maggior parte delle architetture a 32-bit; è di 14K per la maggior |
| parte di quelle a 64-bit; e spesso è condiviso con le interruzioni, |
| per cui non si può usare. |
| Evitare profonde ricorsioni ad enormi array locali nello stack |
| (allocateli dinamicamente). |
| |
| Il kernel Linux è portabile |
| Quindi mantenetelo tale. Il vostro codice dovrebbe essere a 64-bit ed |
| indipendente dall'ordine dei byte (endianess) di un processore. Inoltre, |
| dovreste minimizzare il codice specifico per un processore; per esempio |
| il codice assembly dovrebbe essere incapsulato in modo pulito e minimizzato |
| per facilitarne la migrazione. Generalmente questo codice dovrebbe essere |
| limitato alla parte di kernel specifica per un'architettura. |
| |
| ioctl: non scrivere nuove chiamate di sistema |
| ============================================= |
| |
| Una chiamata di sistema, generalmente, è scritta così:: |
| |
| asmlinkage long sys_mycall(int arg) |
| { |
| return 0; |
| } |
| |
| Primo, nella maggior parte dei casi non volete creare nuove chiamate di |
| sistema. |
| Create un dispositivo a caratteri ed implementate l'appropriata chiamata ioctl. |
| Questo meccanismo è molto più flessibile delle chiamate di sistema: esso non |
| dev'essere dichiarato in tutte le architetture nei file |
| ``include/asm/unistd.h`` e ``arch/kernel/entry.S``; inoltre, è improbabile |
| che questo venga accettato da Linus. |
| |
| Se tutto quello che il vostro codice fa è leggere o scrivere alcuni parametri, |
| considerate l'implementazione di un'interfaccia :c:func:`sysfs()`. |
| |
| All'interno di una ioctl vi trovate nel contesto utente di un processo. Quando |
| avviene un errore dovete ritornare un valore negativo di errno (consultate |
| ``include/uapi/asm-generic/errno-base.h``, |
| ``include/uapi/asm-generic/errno.h`` e ``include/linux/errno.h``), altrimenti |
| ritornate 0. |
| |
| Dopo aver dormito dovreste verificare se ci sono stati dei segnali: il modo |
| Unix/Linux di gestire un segnale è di uscire temporaneamente dalla chiamata |
| di sistema con l'errore ``-ERESTARTSYS``. La chiamata di sistema ritornerà |
| al contesto utente, eseguirà il gestore del segnale e poi la vostra chiamata |
| di sistema riprenderà (a meno che l'utente non l'abbia disabilitata). Quindi, |
| dovreste essere pronti per continuare l'esecuzione, per esempio nel mezzo |
| della manipolazione di una struttura dati. |
| |
| :: |
| |
| if (signal_pending(current)) |
| return -ERESTARTSYS; |
| |
| Se dovete eseguire dei calcoli molto lunghi: pensate allo spazio utente. |
| Se **davvero** volete farlo nel kernel ricordatevi di verificare periodicamente |
| se dovete *lasciare* il processore (ricordatevi che, per ogni processore, c'è |
| un sistema multi-processo senza diritto di prelazione). |
| Esempio:: |
| |
| cond_resched(); /* Will sleep */ |
| |
| Una breve nota sulla progettazione delle interfacce: il motto dei sistemi |
| UNIX è "fornite meccanismi e non politiche" |
| |
| La ricetta per uno stallo |
| ========================= |
| |
| Non è permesso invocare una procedura che potrebbe dormire, fanno eccezione |
| i seguenti casi: |
| |
| - Siete in un contesto utente. |
| |
| - Non trattenete alcun spinlock. |
| |
| - Avete abilitato le interruzioni (in realtà, Andy Kleen dice che |
| lo schedulatore le abiliterà per voi, ma probabilmente questo non è quello |
| che volete). |
| |
| Da tener presente che alcune funzioni potrebbero dormire implicitamente: |
| le più comuni sono quelle per l'accesso allo spazio utente (\*_user) e |
| quelle per l'allocazione della memoria senza l'opzione ``GFP_ATOMIC`` |
| |
| Dovreste sempre compilare il kernel con l'opzione ``CONFIG_DEBUG_ATOMIC_SLEEP`` |
| attiva, questa vi avviserà se infrangete una di queste regole. |
| Se **infrangete** le regole, allora potreste bloccare il vostro scatolotto. |
| |
| Veramente. |
| |
| Alcune delle procedure più comuni |
| ================================= |
| |
| :c:func:`printk()` |
| ------------------ |
| |
| Definita in ``include/linux/printk.h`` |
| |
| :c:func:`printk()` fornisce messaggi alla console, dmesg, e al demone syslog. |
| Essa è utile per il debugging o per la notifica di errori; può essere |
| utilizzata anche all'interno del contesto d'interruzione, ma usatela con |
| cautela: una macchina che ha la propria console inondata da messaggi diventa |
| inutilizzabile. La funzione utilizza un formato stringa quasi compatibile con |
| la printf ANSI C, e la concatenazione di una stringa C come primo argomento |
| per indicare la "priorità":: |
| |
| printk(KERN_INFO "i = %u\n", i); |
| |
| Consultate ``include/linux/kern_levels.h`` per gli altri valori ``KERN_``; |
| questi sono interpretati da syslog come livelli. Un caso speciale: |
| per stampare un indirizzo IP usate:: |
| |
| __be32 ipaddress; |
| printk(KERN_INFO "my ip: %pI4\n", &ipaddress); |
| |
| |
| :c:func:`printk()` utilizza un buffer interno di 1K e non s'accorge di |
| eventuali sforamenti. Accertatevi che vi basti. |
| |
| .. note:: |
| |
| Saprete di essere un vero hacker del kernel quando inizierete a digitare |
| nei vostri programmi utenti le printf come se fossero printk :) |
| |
| .. note:: |
| |
| Un'altra nota a parte: la versione originale di Unix 6 aveva un commento |
| sopra alla funzione printf: "Printf non dovrebbe essere usata per il |
| chiacchiericcio". Dovreste seguire questo consiglio. |
| |
| :c:func:`copy_to_user()` / :c:func:`copy_from_user()` / :c:func:`get_user()` / :c:func:`put_user()` |
| --------------------------------------------------------------------------------------------------- |
| |
| Definite in ``include/linux/uaccess.h`` / ``asm/uaccess.h`` |
| |
| **[DORMONO]** |
| |
| :c:func:`put_user()` e :c:func:`get_user()` sono usate per ricevere ed |
| impostare singoli valori (come int, char, o long) da e verso lo spazio utente. |
| Un puntatore nello spazio utente non dovrebbe mai essere dereferenziato: i dati |
| dovrebbero essere copiati usando suddette procedure. Entrambe ritornano |
| ``-EFAULT`` oppure 0. |
| |
| :c:func:`copy_to_user()` e :c:func:`copy_from_user()` sono più generiche: |
| esse copiano una quantità arbitraria di dati da e verso lo spazio utente. |
| |
| .. warning:: |
| |
| Al contrario di:c:func:`put_user()` e :c:func:`get_user()`, queste |
| funzioni ritornano la quantità di dati copiati (0 è comunque un successo). |
| |
| [Sì, questa stupida interfaccia mi imbarazza. La battaglia torna in auge anno |
| dopo anno. --RR] |
| |
| Le funzioni potrebbero dormire implicitamente. Queste non dovrebbero mai essere |
| invocate fuori dal contesto utente (non ha senso), con le interruzioni |
| disabilitate, o con uno spinlock trattenuto. |
| |
| :c:func:`kmalloc()`/:c:func:`kfree()` |
| ------------------------------------- |
| |
| Definite in ``include/linux/slab.h`` |
| |
| **[POTREBBERO DORMIRE: LEGGI SOTTO]** |
| |
| Queste procedure sono utilizzate per la richiesta dinamica di un puntatore ad |
| un pezzo di memoria allineato, esattamente come malloc e free nello spazio |
| utente, ma :c:func:`kmalloc()` ha un argomento aggiuntivo per indicare alcune |
| opzioni. Le opzioni più importanti sono: |
| |
| ``GFP_KERNEL`` |
| Potrebbe dormire per librarare della memoria. L'opzione fornisce il modo |
| più affidabile per allocare memoria, ma il suo uso è strettamente limitato |
| allo spazio utente. |
| |
| ``GFP_ATOMIC`` |
| Non dorme. Meno affidabile di ``GFP_KERNEL``, ma può essere usata in un |
| contesto d'interruzione. Dovreste avere **davvero** una buona strategia |
| per la gestione degli errori in caso di mancanza di memoria. |
| |
| ``GFP_DMA`` |
| Alloca memoria per il DMA sul bus ISA nello spazio d'indirizzamento |
| inferiore ai 16MB. Se non sapete cos'è allora non vi serve. |
| Molto inaffidabile. |
| |
| Se vedete un messaggio d'avviso per una funzione dormiente che viene chiamata |
| da un contesto errato, allora probabilmente avete usato una funzione |
| d'allocazione dormiente da un contesto d'interruzione senza ``GFP_ATOMIC``. |
| Dovreste correggerlo. Sbrigatevi, non cincischiate. |
| |
| Se allocate almeno ``PAGE_SIZE``(``asm/page.h`` o ``asm/page_types.h``) byte, |
| considerate l'uso di :c:func:`__get_free_pages()` (``include/linux/gfp.h``). |
| Accetta un argomento che definisce l'ordine (0 per per la dimensione di una |
| pagine, 1 per una doppia pagina, 2 per quattro pagine, eccetra) e le stesse |
| opzioni d'allocazione viste precedentemente. |
| |
| Se state allocando un numero di byte notevolemnte superiore ad una pagina |
| potete usare :c:func:`vmalloc()`. Essa allocherà memoria virtuale all'interno |
| dello spazio kernel. Questo è un blocco di memoria fisica non contiguo, ma |
| la MMU vi darà l'impressione che lo sia (quindi, sarà contiguo solo dal punto |
| di vista dei processori, non dal punto di vista dei driver dei dispositivi |
| esterni). |
| Se per qualche strana ragione avete davvero bisogno di una grossa quantità di |
| memoria fisica contigua, avete un problema: Linux non ha un buon supporto per |
| questo caso d'uso perché, dopo un po' di tempo, la frammentazione della memoria |
| rende l'operazione difficile. Il modo migliore per allocare un simile blocco |
| all'inizio dell'avvio del sistema è attraverso la procedura |
| :c:func:`alloc_bootmem()`. |
| |
| Prima di inventare la vostra cache per gli oggetti più usati, considerate |
| l'uso di una cache slab disponibile in ``include/linux/slab.h``. |
| |
| :c:func:`current()` |
| ------------------- |
| |
| Definita in ``include/asm/current.h`` |
| |
| Questa variabile globale (in realtà una macro) contiene un puntatore alla |
| struttura del processo corrente, quindi è valido solo dal contesto utente. |
| Per esempio, quando un processo esegue una chiamata di sistema, questo |
| punterà alla struttura dati del processo chiamate. |
| Nel contesto d'interruzione in suo valore **non è NULL**. |
| |
| :c:func:`mdelay()`/:c:func:`udelay()` |
| ------------------------------------- |
| |
| Definite in ``include/asm/delay.h`` / ``include/linux/delay.h`` |
| |
| Le funzioni :c:func:`udelay()` e :c:func:`ndelay()` possono essere utilizzate |
| per brevi pause. Non usate grandi valori perché rischiate d'avere un |
| overflow - in questo contesto la funzione :c:func:`mdelay()` è utile, |
| oppure considerate :c:func:`msleep()`. |
| |
| :c:func:`cpu_to_be32()`/:c:func:`be32_to_cpu()`/:c:func:`cpu_to_le32()`/:c:func:`le32_to_cpu()` |
| ----------------------------------------------------------------------------------------------- |
| |
| Definite in ``include/asm/byteorder.h`` |
| |
| La famiglia di funzioni :c:func:`cpu_to_be32()` (dove "32" può essere |
| sostituito da 64 o 16, e "be" con "le") forniscono un modo generico |
| per fare conversioni sull'ordine dei byte (endianess): esse ritornano |
| il valore convertito. Tutte le varianti supportano anche il processo inverso: |
| :c:func:`be32_to_cpu()`, eccetera. |
| |
| Queste funzioni hanno principalmente due varianti: la variante per |
| puntatori, come :c:func:`cpu_to_be32p(), che prende un puntatore |
| ad un tipo, e ritorna il valore convertito. L'altra variante per |
| la famiglia di conversioni "in-situ", come :c:func:`cpu_to_be32s()`, |
| che convertono il valore puntato da un puntatore, e ritornano void. |
| |
| :c:func:`local_irq_save()`/:c:func:`local_irq_restore()` |
| -------------------------------------------------------- |
| |
| Definite in ``include/linux/irqflags.h`` |
| |
| Queste funzioni abilitano e disabilitano le interruzioni hardware |
| sul processore locale. Entrambe sono rientranti; esse salvano lo stato |
| precedente nel proprio argomento ``unsigned long flags``. Se sapete |
| che le interruzioni sono abilite, potete semplicemente utilizzare |
| :c:func:`local_irq_disable()` e :c:func:`local_irq_enable()`. |
| |
| .. _it_local_bh_disable: |
| |
| :c:func:`local_bh_disable()`/:c:func:`local_bh_enable()` |
| -------------------------------------------------------- |
| |
| Definite in ``include/linux/bottom_half.h`` |
| |
| |
| Queste funzioni abilitano e disabilitano le interruzioni software |
| sul processore locale. Entrambe sono rientranti; se le interruzioni |
| software erano già state disabilitate in precedenza, rimarranno |
| disabilitate anche dopo aver invocato questa coppia di funzioni. |
| Lo scopo è di prevenire l'esecuzione di softirq e tasklet sul processore |
| attuale. |
| |
| :c:func:`smp_processor_id()` |
| ---------------------------- |
| |
| Definita in ``include/linux/smp.h`` |
| |
| :c:func:`get_cpu()` nega il diritto di prelazione (quindi non potete essere |
| spostati su un altro processore all'improvviso) e ritorna il numero |
| del processore attuale, fra 0 e ``NR_CPUS``. Da notare che non è detto |
| che la numerazione dei processori sia continua. Quando avete terminato, |
| ritornate allo stato precedente con :c:func:`put_cpu()`. |
| |
| Se sapete che non dovete essere interrotti da altri processi (per esempio, |
| se siete in un contesto d'interruzione, o il diritto di prelazione |
| è disabilitato) potete utilizzare smp_processor_id(). |
| |
| |
| ``__init``/``__exit``/``__initdata`` |
| ------------------------------------ |
| |
| Definite in ``include/linux/init.h`` |
| |
| Dopo l'avvio, il kernel libera una sezione speciale; le funzioni marcate |
| con ``__init`` e le strutture dati marcate con ``__initdata`` vengono |
| eliminate dopo il completamento dell'avvio: in modo simile i moduli eliminano |
| questa memoria dopo l'inizializzazione. ``__exit`` viene utilizzato per |
| dichiarare che una funzione verrà utilizzata solo in fase di rimozione: |
| la detta funzione verrà eliminata quando il file che la contiene non è |
| compilato come modulo. Guardate l'header file per informazioni. Da notare che |
| non ha senso avere una funzione marcata come ``__init`` e al tempo stesso |
| esportata ai moduli utilizzando :c:func:`EXPORT_SYMBOL()` o |
| :c:func:`EXPORT_SYMBOL_GPL()` - non funzionerà. |
| |
| |
| :c:func:`__initcall()`/:c:func:`module_init()` |
| ---------------------------------------------- |
| |
| Definite in ``include/linux/init.h`` / ``include/linux/module.h`` |
| |
| Molte parti del kernel funzionano bene come moduli (componenti del kernel |
| caricabili dinamicamente). L'utilizzo delle macro :c:func:`module_init()` |
| e :c:func:`module_exit()` semplifica la scrittura di codice che può funzionare |
| sia come modulo, sia come parte del kernel, senza l'ausilio di #ifdef. |
| |
| La macro :c:func:`module_init()` definisce quale funzione dev'essere |
| chiamata quando il modulo viene inserito (se il file è stato compilato come |
| tale), o in fase di avvio : se il file non è stato compilato come modulo la |
| macro :c:func:`module_init()` diventa equivalente a :c:func:`__initcall()`, |
| la quale, tramite qualche magia del linker, s'assicura che la funzione venga |
| chiamata durante l'avvio. |
| |
| La funzione può ritornare un numero d'errore negativo per scatenare un |
| fallimento del caricamento (sfortunatamente, questo non ha effetto se il |
| modulo è compilato come parte integrante del kernel). Questa funzione è chiamata |
| in contesto utente con le interruzioni abilitate, quindi potrebbe dormire. |
| |
| |
| :c:func:`module_exit()` |
| ----------------------- |
| |
| |
| Definita in ``include/linux/module.h`` |
| |
| Questa macro definisce la funzione che dev'essere chiamata al momento della |
| rimozione (o mai, nel caso in cui il file sia parte integrante del kernel). |
| Essa verrà chiamata solo quando il contatore d'uso del modulo raggiunge lo |
| zero. Questa funzione può anche dormire, ma non può fallire: tutto dev'essere |
| ripulito prima che la funzione ritorni. |
| |
| Da notare che questa macro è opzionale: se non presente, il modulo non sarà |
| removibile (a meno che non usiate 'rmmod -f' ). |
| |
| |
| :c:func:`try_module_get()`/:c:func:`module_put()` |
| ------------------------------------------------- |
| |
| Definite in ``include/linux/module.h`` |
| |
| Queste funzioni maneggiano il contatore d'uso del modulo per proteggerlo dalla |
| rimozione (in aggiunta, un modulo non può essere rimosso se un altro modulo |
| utilizzo uno dei sui simboli esportati: vedere di seguito). Prima di eseguire |
| codice del modulo, dovreste chiamare :c:func:`try_module_get()` su quel modulo: |
| se fallisce significa che il modulo è stato rimosso e dovete agire come se |
| non fosse presente. Altrimenti, potete accedere al modulo in sicurezza, e |
| chiamare :c:func:`module_put()` quando avete finito. |
| |
| La maggior parte delle strutture registrabili hanno un campo owner |
| (proprietario), come nella struttura |
| :c:type:`struct file_operations <file_operations>`. |
| Impostate questo campo al valore della macro ``THIS_MODULE``. |
| |
| |
| Code d'attesa ``include/linux/wait.h`` |
| ====================================== |
| |
| **[DORMONO]** |
| |
| Una coda d'attesa è usata per aspettare che qualcuno vi attivi quando una |
| certa condizione s'avvera. Per evitare corse critiche, devono essere usate |
| con cautela. Dichiarate una :c:type:`wait_queue_head_t`, e poi i processi |
| che vogliono attendere il verificarsi di quella condizione dichiareranno |
| una :c:type:`wait_queue_entry_t` facendo riferimento a loro stessi, poi |
| metteranno questa in coda. |
| |
| Dichiarazione |
| ------------- |
| |
| Potere dichiarare una ``wait_queue_head_t`` utilizzando la macro |
| :c:func:`DECLARE_WAIT_QUEUE_HEAD()` oppure utilizzando la procedura |
| :c:func:`init_waitqueue_head()` nel vostro codice d'inizializzazione. |
| |
| Accodamento |
| ----------- |
| |
| Mettersi in una coda d'attesa è piuttosto complesso, perché dovete |
| mettervi in coda prima di verificare la condizione. Esiste una macro |
| a questo scopo: :c:func:`wait_event_interruptible()` (``include/linux/wait.h``). |
| Il primo argomento è la testa della coda d'attesa, e il secondo è |
| un'espressione che dev'essere valutata; la macro ritorna 0 quando questa |
| espressione è vera, altrimenti ``-ERESTARTSYS`` se è stato ricevuto un segnale. |
| La versione :c:func:`wait_event()` ignora i segnali. |
| |
| Svegliare una procedura in coda |
| ------------------------------- |
| |
| Chiamate :c:func:`wake_up()` (``include/linux/wait.h``); questa attiverà tutti |
| i processi in coda. Ad eccezione se uno di questi è impostato come |
| ``TASK_EXCLUSIVE``, in questo caso i rimanenti non verranno svegliati. |
| Nello stesso header file esistono altre varianti di questa funzione. |
| |
| Operazioni atomiche |
| =================== |
| |
| Certe operazioni sono garantite come atomiche su tutte le piattaforme. |
| Il primo gruppo di operazioni utilizza :c:type:`atomic_t` |
| (``include/asm/atomic.h``); questo contiene un intero con segno (minimo 32bit), |
| e dovete utilizzare queste funzione per modificare o leggere variabili di tipo |
| :c:type:`atomic_t`. :c:func:`atomic_read()` e :c:func:`atomic_set()` leggono ed |
| impostano il contatore, :c:func:`atomic_add()`, :c:func:`atomic_sub()`, |
| :c:func:`atomic_inc()`, :c:func:`atomic_dec()`, e |
| :c:func:`atomic_dec_and_test()` (ritorna vero se raggiunge zero dopo essere |
| stata decrementata). |
| |
| Sì. Ritorna vero (ovvero != 0) se la variabile atomica è zero. |
| |
| Da notare che queste funzioni sono più lente rispetto alla normale aritmetica, |
| e quindi non dovrebbero essere usate a sproposito. |
| |
| Il secondo gruppo di operazioni atomiche sono definite in |
| ``include/linux/bitops.h`` ed agiscono sui bit d'una variabile di tipo |
| ``unsigned long``. Queste operazioni prendono come argomento un puntatore |
| alla variabile, e un numero di bit dove 0 è quello meno significativo. |
| :c:func:`set_bit()`, :c:func:`clear_bit()` e :c:func:`change_bit()` |
| impostano, cancellano, ed invertono il bit indicato. |
| :c:func:`test_and_set_bit()`, :c:func:`test_and_clear_bit()` e |
| :c:func:`test_and_change_bit()` fanno la stessa cosa, ad eccezione che |
| ritornano vero se il bit era impostato; queste sono particolarmente |
| utili quando si vuole impostare atomicamente dei flag. |
| |
| Con queste operazioni è possibile utilizzare indici di bit che eccedono |
| il valore ``BITS_PER_LONG``. Il comportamento è strano sulle piattaforme |
| big-endian quindi è meglio evitarlo. |
| |
| Simboli |
| ======= |
| |
| All'interno del kernel, si seguono le normali regole del linker (ovvero, |
| a meno che un simbolo non venga dichiarato con visibilita limitata ad un |
| file con la parola chiave ``static``, esso può essere utilizzato in qualsiasi |
| parte del kernel). Nonostante ciò, per i moduli, esiste una tabella dei |
| simboli esportati che limita i punti di accesso al kernel. Anche i moduli |
| possono esportare simboli. |
| |
| :c:func:`EXPORT_SYMBOL()` |
| ------------------------- |
| |
| Definita in ``include/linux/export.h`` |
| |
| Questo è il classico metodo per esportare un simbolo: i moduli caricati |
| dinamicamente potranno utilizzare normalmente il simbolo. |
| |
| :c:func:`EXPORT_SYMBOL_GPL()` |
| ----------------------------- |
| |
| Definita in ``include/linux/export.h`` |
| |
| Essa è simile a :c:func:`EXPORT_SYMBOL()` ad eccezione del fatto che i |
| simboli esportati con :c:func:`EXPORT_SYMBOL_GPL()` possono essere |
| utilizzati solo dai moduli che hanno dichiarato una licenza compatibile |
| con la GPL attraverso :c:func:`MODULE_LICENSE()`. Questo implica che la |
| funzione esportata è considerata interna, e non una vera e propria interfaccia. |
| Alcuni manutentori e sviluppatori potrebbero comunque richiedere |
| :c:func:`EXPORT_SYMBOL_GPL()` quando si aggiungono nuove funzionalità o |
| interfacce. |
| |
| Procedure e convenzioni |
| ======================= |
| |
| Liste doppiamente concatenate ``include/linux/list.h`` |
| ------------------------------------------------------ |
| |
| Un tempo negli header del kernel c'erano tre gruppi di funzioni per |
| le liste concatenate, ma questa è stata la vincente. Se non avete particolari |
| necessità per una semplice lista concatenata, allora questa è una buona scelta. |
| |
| In particolare, :c:func:`list_for_each_entry()` è utile. |
| |
| Convenzione dei valori di ritorno |
| --------------------------------- |
| |
| Per codice chiamato in contesto utente, è molto comune sfidare le convenzioni |
| C e ritornare 0 in caso di successo, ed un codice di errore negativo |
| (eg. ``-EFAULT``) nei casi fallimentari. Questo potrebbe essere controintuitivo |
| a prima vista, ma è abbastanza diffuso nel kernel. |
| |
| Utilizzate :c:func:`ERR_PTR()` (``include/linux/err.h``) per codificare |
| un numero d'errore negativo in un puntatore, e :c:func:`IS_ERR()` e |
| :c:func:`PTR_ERR()` per recuperarlo di nuovo: così si evita d'avere un |
| puntatore dedicato per il numero d'errore. Da brividi, ma in senso positivo. |
| |
| Rompere la compilazione |
| ----------------------- |
| |
| Linus e gli altri sviluppatori a volte cambiano i nomi delle funzioni e |
| delle strutture nei kernel in sviluppo; questo non è solo per tenere |
| tutti sulle spine: questo riflette cambiamenti fondamentati (eg. la funzione |
| non può più essere chiamata con le funzioni attive, o fa controlli aggiuntivi, |
| o non fa più controlli che venivano fatti in precedenza). Solitamente a questo |
| s'accompagna un'adeguata e completa nota sulla lista di discussone |
| linux-kernel; cercate negli archivi. |
| Solitamente eseguire una semplice sostituzione su tutto un file rendere |
| le cose **peggiori**. |
| |
| Inizializzazione dei campi d'una struttura |
| ------------------------------------------ |
| |
| Il metodo preferito per l'inizializzazione delle strutture è quello |
| di utilizzare gli inizializzatori designati, come definiti nello |
| standard ISO C99, eg:: |
| |
| static struct block_device_operations opt_fops = { |
| .open = opt_open, |
| .release = opt_release, |
| .ioctl = opt_ioctl, |
| .check_media_change = opt_media_change, |
| }; |
| |
| Questo rende più facile la ricerca con grep, e rende più chiaro quale campo |
| viene impostato. Dovreste fare così perché si mostra meglio. |
| |
| Estensioni GNU |
| -------------- |
| |
| Le estensioni GNU sono esplicitamente permesse nel kernel Linux. Da notare |
| che alcune delle più complesse non sono ben supportate, per via dello scarso |
| sviluppo, ma le seguenti sono da considerarsi la norma (per maggiori dettagli, |
| leggete la sezione "C Extensions" nella pagina info di GCC - Sì, davvero |
| la pagina info, la pagina man è solo un breve riassunto delle cose nella |
| pagina info). |
| |
| - Funzioni inline |
| |
| - Istruzioni in espressioni (ie. il costrutto ({ and }) ). |
| |
| - Dichiarate attributi di una funzione / variabile / tipo |
| (__attribute__) |
| |
| - typeof |
| |
| - Array con lunghezza zero |
| |
| - Macro varargs |
| |
| - Aritmentica sui puntatori void |
| |
| - Inizializzatori non costanti |
| |
| - Istruzioni assembler (non al di fuori di 'arch/' e 'include/asm/') |
| |
| - Nomi delle funzioni come stringhe (__func__). |
| |
| - __builtin_constant_p() |
| |
| Siate sospettosi quando utilizzate long long nel kernel, il codice generato |
| da gcc è orribile ed anche peggio: le divisioni e le moltiplicazioni non |
| funzionano sulle piattaforme i386 perché le rispettive funzioni di runtime |
| di GCC non sono incluse nell'ambiente del kernel. |
| |
| C++ |
| --- |
| |
| Solitamente utilizzare il C++ nel kernel è una cattiva idea perché |
| il kernel non fornisce il necessario ambiente di runtime e gli header file |
| non sono stati verificati. Rimane comunque possibile, ma non consigliato. |
| Se davvero volete usarlo, almeno evitate le eccezioni. |
| |
| NUMif |
| ----- |
| |
| Viene generalmente considerato più pulito l'uso delle macro negli header file |
| (o all'inizio dei file .c) per astrarre funzioni piuttosto che utlizzare |
| l'istruzione di pre-processore \`#if' all'interno del codice sorgente. |
| |
| Mettere le vostre cose nel kernel |
| ================================= |
| |
| Al fine d'avere le vostre cose in ordine per l'inclusione ufficiale, o |
| anche per avere patch pulite, c'è del lavoro amministrativo da fare: |
| |
| - Trovare di chi è lo stagno in cui state pisciando. Guardare in cima |
| ai file sorgenti, all'interno del file ``MAINTAINERS``, ed alla fine |
| di tutti nel file ``CREDITS``. Dovreste coordinarvi con queste persone |
| per evitare di duplicare gli sforzi, o provare qualcosa che è già stato |
| rigettato. |
| |
| Assicuratevi di mettere il vostro nome ed indirizzo email in cima a |
| tutti i file che create o che mangeggiate significativamente. Questo è |
| il primo posto dove le persone guarderanno quando troveranno un baco, |
| o quando **loro** vorranno fare una modifica. |
| |
| - Solitamente vorrete un'opzione di configurazione per la vostra modifica |
| al kernel. Modificate ``Kconfig`` nella cartella giusta. Il linguaggio |
| Config è facile con copia ed incolla, e c'è una completa documentazione |
| nel file ``Documentation/kbuild/kconfig-language.txt``. |
| |
| Nella descrizione della vostra opzione, assicuratevi di parlare sia agli |
| utenti esperti sia agli utente che non sanno nulla del vostro lavoro. |
| Menzionate qui le incompatibilità ed i problemi. Chiaramente la |
| descrizione deve terminare con “if in doubt, say N” (se siete in dubbio, |
| dite N) (oppure, occasionalmente, \`Y'); questo è per le persone che non |
| hanno idea di che cosa voi stiate parlando. |
| |
| - Modificate il file ``Makefile``: le variabili CONFIG sono esportate qui, |
| quindi potete solitamente aggiungere una riga come la seguete |
| "obj-$(CONFIG_xxx) += xxx.o". La sintassi è documentata nel file |
| ``Documentation/kbuild/makefiles.txt``. |
| |
| - Aggiungete voi stessi in ``CREDITS`` se avete fatto qualcosa di notevole, |
| solitamente qualcosa che supera il singolo file (comunque il vostro nome |
| dovrebbe essere all'inizio dei file sorgenti). ``MAINTAINERS`` significa |
| che volete essere consultati quando vengono fatte delle modifiche ad un |
| sottosistema, e quando ci sono dei bachi; questo implica molto di più |
| di un semplice impegno su una parte del codice. |
| |
| - Infine, non dimenticatevi di leggere |
| ``Documentation/process/submitting-patches.rst`` e possibilmente anche |
| ``Documentation/process/submitting-drivers.rst``. |
| |
| Trucchetti del kernel |
| ===================== |
| |
| Dopo una rapida occhiata al codice, questi sono i preferiti. Sentitevi liberi |
| di aggiungerne altri. |
| |
| ``arch/x86/include/asm/delay.h``:: |
| |
| #define ndelay(n) (__builtin_constant_p(n) ? \ |
| ((n) > 20000 ? __bad_ndelay() : __const_udelay((n) * 5ul)) : \ |
| __ndelay(n)) |
| |
| |
| ``include/linux/fs.h``:: |
| |
| /* |
| * Kernel pointers have redundant information, so we can use a |
| * scheme where we can return either an error code or a dentry |
| * pointer with the same return value. |
| * |
| * This should be a per-architecture thing, to allow different |
| * error and pointer decisions. |
| */ |
| #define ERR_PTR(err) ((void *)((long)(err))) |
| #define PTR_ERR(ptr) ((long)(ptr)) |
| #define IS_ERR(ptr) ((unsigned long)(ptr) > (unsigned long)(-1000)) |
| |
| ``arch/x86/include/asm/uaccess_32.h:``:: |
| |
| #define copy_to_user(to,from,n) \ |
| (__builtin_constant_p(n) ? \ |
| __constant_copy_to_user((to),(from),(n)) : \ |
| __generic_copy_to_user((to),(from),(n))) |
| |
| |
| ``arch/sparc/kernel/head.S:``:: |
| |
| /* |
| * Sun people can't spell worth damn. "compatability" indeed. |
| * At least we *know* we can't spell, and use a spell-checker. |
| */ |
| |
| /* Uh, actually Linus it is I who cannot spell. Too much murky |
| * Sparc assembly will do this to ya. |
| */ |
| C_LABEL(cputypvar): |
| .asciz "compatibility" |
| |
| /* Tested on SS-5, SS-10. Probably someone at Sun applied a spell-checker. */ |
| .align 4 |
| C_LABEL(cputypvar_sun4m): |
| .asciz "compatible" |
| |
| |
| ``arch/sparc/lib/checksum.S:``:: |
| |
| /* Sun, you just can't beat me, you just can't. Stop trying, |
| * give up. I'm serious, I am going to kick the living shit |
| * out of you, game over, lights out. |
| */ |
| |
| |
| Ringraziamenti |
| ============== |
| |
| Ringrazio Andi Kleen per le sue idee, le risposte alle mie domande, |
| le correzioni dei miei errori, l'aggiunta di contenuti, eccetera. |
| Philipp Rumpf per l'ortografia e per aver reso più chiaro il testo, e |
| per alcuni eccellenti punti tutt'altro che ovvi. Werner Almesberger |
| per avermi fornito un ottimo riassunto di :c:func:`disable_irq()`, |
| e Jes Sorensen e Andrea Arcangeli per le precisazioni. Michael Elizabeth |
| Chastain per aver verificato ed aggiunto la sezione configurazione. |
| Telsa Gwynne per avermi insegnato DocBook. |