Differences

This shows you the differences between two versions of the page.

Link to this comparison view

asc:laboratoare:08 [2025/04/23 07:22]
alexandru.bala [Arhitectura Intel]
asc:laboratoare:08 [2025/04/23 08:18] (current)
alexandru.bala [Comparatie intre servere AMD si Intel]
Line 177: Line 177:
 ===== Arhitectura Intel ===== ===== Arhitectura Intel =====
  
-O schema clasica pentru un sistem CISC este prezentata in Figura 1. Aici se poate distinge usor in partea de sus Procesorul, legat de restul sistemului prin Front-Side-Bus (FSB) de 400/​533/​800MHz catre North Bridge (i.e. 82865PE MCH). Pe North Bridge se afla controllerul de memorie, si ca atare si memoriile sunt conectate direct aici prin canale intre 2.1GB/s si 3.2GB/s. De asemenea pe North Bridge se conecteaza atat placa grafica (Accelerated Graphics Port - AGP 8x/4x) cat si interfata de retea de mare viteza Gigabit Ethernet.+O schema clasica pentru un sistem CISC este prezentata in Figura 1. Aici se poate distinge usor in partea de sus Procesorul, legat de restul sistemului prin Front-Side-Bus (FSB) de 400/​533/​800MHz catre North Bridge (i.e. 82865PE MCH). Pe North Bridge se afla controllerul de memorie, si ca atare si memoriile sunt conectate direct aici prin canale intre 2.1GB/s si 3.2GB/s. De asemenea pe North Bridge se conecteaza atat placa grafica (Accelerated Graphics Port - AGP 8x/4x)cat si interfata de retea de mare viteza Gigabit Ethernet.
    
 {{ :​asc:​lab4:​865pe.jpg?​640 |Figura 1. Schema bloc a Chipsetului Intel® 865PE }} {{ :​asc:​lab4:​865pe.jpg?​640 |Figura 1. Schema bloc a Chipsetului Intel® 865PE }}
  
-La randul sau North Bridge-ul este conectat printr-o legatura de 266MB/s catre South Bridge (i.e. 82801EB ICH5 / 82801ER ICH5R). Dupa cum se poate vedea, North Bridge-ul ​impreauna ​cu South Bridge-ul formeaza ​impreauna ​ceea ce se numeste Chipsetul Intel® 865PE. Urmarind in continuare schema din Figura 1, se observa ca pe South Bridge se conecteaza o multitudine de componente periferice cu o viteza si rata de transfer de date considerabil mai scazuta decat elementele conectate pe North Bridge, cum ar fi: AC97 (placa audio), porturi ATA si Serial ATA, porturi USB, sistem de management si de control al consumului, etc.+La randul sau North Bridge-ul este conectat printr-o legatura de 266MB/s catre South Bridge (i.e. 82801EB ICH5 / 82801ER ICH5R). Dupa cum se poate vedea, North Bridge-ul ​impreuna ​cu South Bridge-ul formeaza ​impreuna ​ceea ce se numeste Chipsetul Intel® 865PE. Urmarind in continuare schema din Figura 1, se observa ca pe South Bridge se conecteaza o multitudine de componente periferice cu o viteza si rata de transfer de date considerabil mai scazuta decat elementele conectate pe North Bridge, cum ar fi: AC97 (placa audio), porturi ATA si Serial ATA, porturi USB, sistem de management si de control al consumului, etc.
  
 Din aceasta schema se poate usor deduce ca punctul vulnerabil al acestor sisteme il constituie integrarea controllerului de memorie pe North Bridge, si in special legaturile de marime limitata intre South si North Bridge, precum si intre North Bridge si procesor. In mod evident, dimensionarea acestora este un compromis de design al sistemelor Intel, menit sa deserveasca majoritatea sistemelor hardware bazate pe acest Chipset, si a aplicatiilor ce ruleaza pe ele.  Din aceasta schema se poate usor deduce ca punctul vulnerabil al acestor sisteme il constituie integrarea controllerului de memorie pe North Bridge, si in special legaturile de marime limitata intre South si North Bridge, precum si intre North Bridge si procesor. In mod evident, dimensionarea acestora este un compromis de design al sistemelor Intel, menit sa deserveasca majoritatea sistemelor hardware bazate pe acest Chipset, si a aplicatiilor ce ruleaza pe ele. 
Line 189: Line 189:
 {{ :​asc:​lab4:​intel7300chipset.jpg?​640 |Figura 2. Schema bloc a Chipsetului Intel® 7300}} {{ :​asc:​lab4:​intel7300chipset.jpg?​640 |Figura 2. Schema bloc a Chipsetului Intel® 7300}}
  
-Aici se poate observa conectarea a patru procesoare catre North Bridge (MCH) prin canale distincte FSB, de 1066MHz fiecare, menite sa asigure o alimentare eficienta cu date a acestora. Controllerul de memorie ramane pe North Bridge insa memoria se conecteaza prin patru canale de 8GB/s. Apar pe North Bridge conexiuni multiple PCI-Express (PCI-E), placa de retea devine doar "una dintre acestea"​;, iar largimea ​de banda este crescuta pentru fiecare dintre ​acest componente fata de versiunile anterioare de Chipseturi. ​+Aici se poate observa conectarea a patru procesoare catre North Bridge (MCH - Memory Controller Hub) prin canale distincte FSB, de 1066MHz fiecare, menite sa asigure o alimentare eficienta cu date a acestora. Controllerul de memorie ramane pe North Bridge insa memoria se conecteaza prin patru canale de 8GB/s. Apar pe North Bridge conexiuni multiple PCI-Express (PCI-E), placa de retea devine doar "una dintre acestea",​ iar latimea ​de banda este crescuta pentru fiecare dintre ​aceste ​componente fata de versiunile anterioare de Chipseturi. ​
  
 Pentru simplitate, si conexiunea intre North Bridge si South Bridge (631xESB I/O Controller) este realizata prin conexiuni PCI Express 2x sau chiar 4x. Este sugestiv de asemenea faptul ca South Bridge-ul poarta acum numele de "I/O Controller"​ si se consfinteste astfel si prin nume direct rolul South Bridge-ului. Porturile ATA sunt inlocuite acum de SATA si PATA, apar din nou numeroase porturi PCI-E si PCI-X, USB, de gestiune a consumului, a biosului sau placi aditionale de retea pentru management. Pentru simplitate, si conexiunea intre North Bridge si South Bridge (631xESB I/O Controller) este realizata prin conexiuni PCI Express 2x sau chiar 4x. Este sugestiv de asemenea faptul ca South Bridge-ul poarta acum numele de "I/O Controller"​ si se consfinteste astfel si prin nume direct rolul South Bridge-ului. Porturile ATA sunt inlocuite acum de SATA si PATA, apar din nou numeroase porturi PCI-E si PCI-X, USB, de gestiune a consumului, a biosului sau placi aditionale de retea pentru management.
Line 196: Line 196:
  
 Anexa: Anexa:
-Magistrale uzuale si largimea ​lor de banda maxima ​+Magistrale uzuale si latimea ​lor de banda maxima ​
  
 ^ Bus ^ Max Bandwidth ^ ^ Bus ^ Max Bandwidth ^
Line 214: Line 214:
  
 <note tip> <note tip>
-PCI Express este o magistrala seriala (datele pot circula simultan in ambele directii). In tabelul de mai sus cele doua valori pentru ​largimea ​de banda corespund ​largimii ​de banda intr-o singura directie respectiv in ambele directii (combinat).+PCI Express este o magistrala seriala (datele pot circula simultan in ambele directii). In tabelul de mai sus cele doua valori pentru ​latimea ​de banda corespund ​latimii ​de banda intr-o singura directierespectiv in ambele directii (combinat).
 </​note>​ </​note>​
  
Line 221: Line 221:
 Din familia Hammer, sau AMD64, face parte cel mai puternic procesor de la AMD, si anume Opteron. Opteronul este echivalentul familiilor Intel Itanium si Intel Xeon, destinat serverelor si sitemelor de inalta performanta. Opteron este un procesor out-of-order si in interiorul unitatii de executie ordinea instructiunilor este schimbata, pentru a maximiza eficienta. Pentru utilizatorul extern insa, instructiunile par a se executa in aceeasi ordine in care au fost lansate. De asemenea, el este 3-way superscalar,​ adica poate decoda, executa si incheia trei instructiuni x86 la fiecare ciclu masina. Desi poate lucra in paralel la 3 instructiuni,​ aceasta nu insemna neaparat ca cele 3 instructiuni sunt procesate in intregime pe acea perioda de ceas. Opteronul a fost creat pentru a putea lucra in sisteme multiprocesor si fiind primul care a oferit o scalabilitate sporita, el a acaparat la vremea respectiva o portiune semnificativa din piata comerciala de servere. ​ Din familia Hammer, sau AMD64, face parte cel mai puternic procesor de la AMD, si anume Opteron. Opteronul este echivalentul familiilor Intel Itanium si Intel Xeon, destinat serverelor si sitemelor de inalta performanta. Opteron este un procesor out-of-order si in interiorul unitatii de executie ordinea instructiunilor este schimbata, pentru a maximiza eficienta. Pentru utilizatorul extern insa, instructiunile par a se executa in aceeasi ordine in care au fost lansate. De asemenea, el este 3-way superscalar,​ adica poate decoda, executa si incheia trei instructiuni x86 la fiecare ciclu masina. Desi poate lucra in paralel la 3 instructiuni,​ aceasta nu insemna neaparat ca cele 3 instructiuni sunt procesate in intregime pe acea perioda de ceas. Opteronul a fost creat pentru a putea lucra in sisteme multiprocesor si fiind primul care a oferit o scalabilitate sporita, el a acaparat la vremea respectiva o portiune semnificativa din piata comerciala de servere. ​
  
-Printre cele mai importante imbunatatiri arhitecturale cu care vine Hammer (generatia 8) fata de Athlon si AthlonXP (generatia 7) se numara: doua stagii in plus la pipeline, algoritmi imbunatatiti de predictie a ramificatiilor,​ suport pentru SSE2 (Streaming Multimedia Instructions),​ controller de memorie integrat in CPU si extensie completa pentru setul de instructiuni pe 64 biti pentru x86. Toate procesoarele Hammer au viteze de maxim 2.5GHz. Pe de alta parte, Intel s-a concentrat mai mult pe cresterea vitezei, fara a se preocupa excesiv de paralelism, acest trend a fost insa oprit din 2007-2008, cand si Intel, si AMD au trecut la producerea de sisteme multi-core. Acest lucru este important in lumea serverelor, unde disiparea caldurii este o problema principala. Intel insa a venit si cu o noua "​arma"​ si anume tehnologia de integrare bazata pe dielectrici High-K, ce a dus la o scadere drastica a consumului, si a permis de asemenea performante considerabile la frecvente de executie scazute.+Printre cele mai importante imbunatatiri arhitecturale cu care vine Hammer (generatia 8) fata de Athlon si AthlonXP (generatia 7) se numara: doua stagii in plus la pipeline, algoritmi imbunatatiti de predictie a ramificatiilor,​ suport pentru SSE2 (Streaming SIMD Extension 2 - Streaming Multimedia Instructions),​ controller de memorie integrat in CPU si extensie completa pentru setul de instructiuni pe 64 biti pentru x86. Toate procesoarele Hammer au viteze de maxim 2.5GHz. Pe de alta parte, Intel s-a concentrat mai mult pe cresterea vitezei, fara a se preocupa excesiv de paralelism, acest trend a fost insa oprit din 2007-2008, cand si Intel, si AMD au trecut la producerea de sisteme multi-core. Acest lucru este important in lumea serverelor, unde disiparea caldurii este o problema principala. Intel insa a venit si cu o noua "​arma"​ si anume tehnologia de integrare bazata pe dielectrici High-K, ce a dus la o scadere drastica a consumului, si a permis de asemenea performante considerabile la frecvente de executie scazute.
  
 {{ :​asc:​lab4:​amdquadcorephenom.jpg?​640 |Figura 3. Arhitectura Procesorului Quad-Core Phenom}} {{ :​asc:​lab4:​amdquadcorephenom.jpg?​640 |Figura 3. Arhitectura Procesorului Quad-Core Phenom}}
Line 241: Line 241:
 ==== Hypertransport ==== ==== Hypertransport ====
  
-Hypertransport este o tehnologie pentru I/O dezvoltata initial de AMD. Ea este o alternativa la sistemele actuale de bus. Foloseste legaturi duble, punct la punct, pentru a lega componentele intre ele. Este, in termeni de retele, echivalentul unei legaturi full-duplex punct la punct fata de o topologie ​buss.+Hypertransport este o tehnologie pentru I/O dezvoltata initial de AMD. Ea este o alternativa la sistemele actuale de bus. Foloseste legaturi duble, punct la punct, pentru a lega componentele intre ele. Este, in termeni de retele, echivalentul unei legaturi full-duplex punct la punct fata de o topologie ​bus.
  
 <note tip> <note tip>
-O astfel de lagatura poate avea intre si 64 biti, si poate opera la viteze de 400Mhz-2.6GHz. Datele sunt impachetate ​ si trimise folosind un protocol care  prevede trimiterea de pachete multiplu de 4 bytes, cu marimi intre 4 si 64 bytes.+O astfel de lagatura poate avea intre si 64 biti, si poate opera la viteze de 400Mhz-2.6GHz. Datele sunt impachetate ​ si trimise folosind un protocol care  prevede trimiterea de pachete multiplu de 4 bytes, cu marimi intre 4 si 64 bytes.
 </​note>​ </​note>​
  
Line 260: Line 260:
  
 <note tip> <note tip>
-Liniile sunt de 16 biti, bidirectionale cu frecvente intre 200 Mhz si 800Mhz, de aici rezultand o viteza de 6.4Gbytes/sec (3.2Gbytes/sec  in fiecare directie). Cum Opteron are 3 astfel de lagaturi, poate comunica deci 19.2 Gbytes/sec.+Liniile sunt de 16 biti, bidirectionale cu frecvente intre 200Mhz ​si 800Mhz, de aici rezultand o viteza de 6.4 Gbytes/sec (3.2 Gbytes/sec  in fiecare directie). Cum Opteron are 3 astfel de lagaturi, poate comunicadeci, cu 19.2 Gbytes/sec.
 </​note>​ </​note>​
  
 ===== Cipuri ce conecteaza prin Hypertransport core-uri AMD ===== ===== Cipuri ce conecteaza prin Hypertransport core-uri AMD =====
  
-  *AMD8151 Hypertransport AGP Tunnel: Controller grafic AGP3.0 . Este practic ce a mai ramas din NorthBridge dupa integrarea controller-ului 
   *AMD8131 Hypertransport PCI-X Tunnel: Are rol de bus cu PCI-X   *AMD8131 Hypertransport PCI-X Tunnel: Are rol de bus cu PCI-X
 +  *AMD8151 Hypertransport AGP Tunnel: Controller grafic AGP3.0 . Este practic ce a mai ramas din NorthBridge dupa integrarea controller-ului
   *AMD8111 Hypertransport I/O Hub: Are functionalitate standard de SouthBridge,​ incluzand controller PCI, BIOS,​USB,​hard disk, retea si audio.   *AMD8111 Hypertransport I/O Hub: Are functionalitate standard de SouthBridge,​ incluzand controller PCI, BIOS,​USB,​hard disk, retea si audio.
  
Line 277: Line 277:
 {{ :​asc:​lab4:​fsb_evolution.jpg?​640 |Figura 9. Evolutia Front-side-Bus-ului in sistemele Intel}} {{ :​asc:​lab4:​fsb_evolution.jpg?​640 |Figura 9. Evolutia Front-side-Bus-ului in sistemele Intel}}
  
-Acest sistem de interconectare este practic identic functional cu HyperTransport. Intre timp, procesoarele Intel au incorporat si ele controller-ul de memorie, si astfel cei doi mari competitori pe piata procesoarelor de uz general sunt pregatiti in aceeasi masura pentru sisteme multi-core cu multe procesoare, memorie multa si aplicatii multi-pthreading ​pe scara larga:+Acest sistem de interconectare este practic identic functional cu HyperTransport. Intre timp, procesoarele Intel au incorporat si ele controller-ul de memorie, si astfel cei doi mari competitori pe piata procesoarelor de uz general sunt pregatiti in aceeasi masura pentru sisteme multi-core cu multe procesoare, memorie multa si aplicatii multi-threading ​pe scara larga:
  
 {{ :​asc:​lab4:​intel-qpi-1.jpg?​640 |Figura 10. Arhitectura Intel QuickPath Interconnect }} {{ :​asc:​lab4:​intel-qpi-1.jpg?​640 |Figura 10. Arhitectura Intel QuickPath Interconnect }}
Line 305: Line 305:
 Generatia Phenom de microprocesoare de la AMD este competitorul direct al Intel Xeon si Intel Itanium. Cele doua arhitecturi,​ Intel versus AMD sunt fundamental diferite, dar ofera performante comparabile,​ in functie de domeniul de aplicatie ales pentru comparatie. Generatia Phenom de microprocesoare de la AMD este competitorul direct al Intel Xeon si Intel Itanium. Cele doua arhitecturi,​ Intel versus AMD sunt fundamental diferite, dar ofera performante comparabile,​ in functie de domeniul de aplicatie ales pentru comparatie.
  
-O prima mare diferenta intre cele doua arhitecturi este modul in care cele doua abordeaza compatibilitatea cu 32 de biti. Astfel, de la Hammer incoace, AMD a ales sa extinda setul actual de instructiuni x86 pentru 32biti cu instructiuni pentru 64, in timp ce Intel a renuntat complet la setul x86, trecand in mod radical la IA64. Compatibilitatea la AMD este asigurata automat, noul set de instructiuni fiind doar o extensie e acelui vechi. La Intel, compatibilitatea cu 32 biti se face prin emularea vechiului set. Fiind o emulare, exista penalizari de performanta. Pe de alta parte insa, Intel a reusit sa scape in acest fel de complicatii de arhitectura inutile intr-o lume numai de 64 biti. Ambele tipuri mari de arhitecturi de procesoare, Intel si AMD, au trecut in ultimele generatii de procesoare la emularea setului de instructiuni x86 catre micro-operatii specifice fiecarei generatii de procesoare.+O prima mare diferenta intre cele doua arhitecturi este modul in care cele doua abordeaza compatibilitatea cu 32 de biti. Astfel, de la Hammer incoace, AMD a ales sa extinda setul actual de instructiuni x86 pentru 32biti cu instructiuni pentru 64, in timp ce Intel a renuntat complet la setul x86, trecand in mod radical la IA64. Compatibilitatea la AMD este asigurata automat, noul set de instructiuni fiind doar o extensie e acelui vechi. La Intel, compatibilitatea cu 32 biti se face prin emularea vechiului set. Fiind o emulare, exista penalizari de performanta. Pe de alta parte insa, Intel a reusit sa scape in acest fel de complicatii de arhitectura inutile intr-o lume numai de 64 biti. Ambele tipuri mari de arhitecturi de procesoare, Intel si AMD, au trecut in ultimele generatii de procesoare ​de la emularea setului de instructiuni x86 catre micro-operatii specifice fiecarei generatii de procesoare.
  
 O alta diferenta este legatura dintre performanta,​ viteza ceasului si gradul de paralelism oferit. Astfel, la inceput Intel s-a concentrat pe marirea frecventei de ceas, si mai putin pe efectuarea de mai multe operatii in paralel. AMD ofera frecvente mai mici, dar a pus mult accent pe paralelism. Astfel performanta e oferita de AMD la frecvente mult mai mici decat Intel. Un avantaj al acestui fapt este ca AMD elimina astfel problemele de disipare a caldurii. Aceste aspecte sunt esentiale mai ales in domeniul serverelor. In ultimii ani Intel merge pe aceeasi cale, si se axeaza in principal pe cresterea numarului de core-uri si nu a frecventei de procesare, cu aceleasi avantaje mentionate anterior. O alta diferenta este legatura dintre performanta,​ viteza ceasului si gradul de paralelism oferit. Astfel, la inceput Intel s-a concentrat pe marirea frecventei de ceas, si mai putin pe efectuarea de mai multe operatii in paralel. AMD ofera frecvente mai mici, dar a pus mult accent pe paralelism. Astfel performanta e oferita de AMD la frecvente mult mai mici decat Intel. Un avantaj al acestui fapt este ca AMD elimina astfel problemele de disipare a caldurii. Aceste aspecte sunt esentiale mai ales in domeniul serverelor. In ultimii ani Intel merge pe aceeasi cale, si se axeaza in principal pe cresterea numarului de core-uri si nu a frecventei de procesare, cu aceleasi avantaje mentionate anterior.
asc/laboratoare/08.1745382139.txt.gz · Last modified: 2025/04/23 07:22 by alexandru.bala
CC Attribution-Share Alike 3.0 Unported
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0