MTA Wigner GPU Labor

Elérhető a Codeplay SYCL implementációja

09/20/2016

A Khronos SYCL specifikációjának első, GPU-s implementációját tette elérhetővé a CODEPLAY "ComputeCpp" néven.

Az egyelőre csak béta állapotban és csak linuxra elérhető fordító segítségével C++11 szinten, egyetlen forrásfileból fordíthatóak masszívan párhuzamos, illetve hierarchikusan párhuzamos kódok a gazda és eszközoldalra egyaránt. Az OpenCL 1.2-re épülő rendszer AMD és Intel eszközökön használható jelenleg, valamint gyorsítást kínál az Eigen lineárisalgebrai, a VisionCpp gépilátásos, valamint a C++17 párhuzamos algoritmus könyvtáraihoz. 

A későbbiekben várhatóan Windowsra is elérhető eszköz szabadon felhasználható lesz akár kereskedelmi, akár nem kereskedelmi célra is, és következő lépésként az OpenCL 2.2-re építve a jeleleg előzetes SYCL 2.2 specifikációt is implementálni fogja.

A fordító regisztráció után a CODEPLAY oldaláról tölthető le.

További hasznos információk és a ComputeCpp-re épülő projektek a sycl.tech weboldalon találhatóak.

Xeon Phi (KNC) Workshop

09/13/2016 10:11:55 pm

A NIIF Xeon Phi (Knights Corner) workshopot hirdet az Intel és a HPE szponzorálásával. A workshopot a Bayncore tapasztalt HPC Technologies oktatói tartják.

Ez egy kiváló lehetőség, hogy az érdeklődők megismerhessék a Xeon Phi-k HPC környezetben történő programozásának technikáját és eszközeit, illetve a résztvevők számára lehetőséget biztosítunk mindezek kipróbálására a workshop ideje alatt.

Lehetőség szerint mindenki hozzon magával notebookot rajta a kedvenc SSH kliensével és egy előre generált private/public kulcspárral, ha még nincs accountja a szervereinken. A 8:30 előtt érkezőknek kollégáink szívesen segítenek generálni és telepíteni a kulcsokat a helyszínen.

Ez a rendezvény egyedülálló a maga nemében a régióban. Használj fel kevesebb processzor időt a NIIF HPC-en Xeon Phi-k segítségével, csupán egyszerű eszközök és programozási trükkök alkalmazásával. Szerezz tapasztalatot az egyik legfelkapottabb technológiák egyikében és válj szakértővé a tudományos számítások Phi-k segítségével történő gyorsításában..

Az esemény teljesen ingyenes, hála szponzorainknak!

Részletek és regisztráció:

http://conference.niif.hu/e/xeonphiworkshop

Találkozunk ott!

6. Wigner GPU Nap

05/12/2016

A Wigner Fizikai Kutatóközpont idén 6. alkalommal rendezi meg a 

GPU Day - The Future of Many-Core Computing in Science

eseményét, ahol hazai és nemzetközi fejlesztők és kutatók foglalják össze a grafikus processzorokkal és más párhuzamos architektúrákkal megvalósított eredményeiket a tudományok és az ipar számos különböző területéről.

A előadások angol nyelvűek, látogatásuk ingyenes, de regisztrációhoz kötött.

További információk és regisztráció a weboldalon.

Az absztraktok gyűjteménye elérhető itt.

Megjelent a Vulkan 1.0!

02/16/2016

A Khronos és a hardvergyártók ma együtt elérhetővé tették a Vulkan grafikus és számítási programozási felület specifikációját és a szükséges drivereket minden platformra.

A bejelentés itt, a specifikáció itt érhető el.

Modern Tudományos Programozás Előadás-sorozat

11/02/2015

Modern Tudományos Programozás Előadás-sorozat

A Wigner GPU-Labor egy három napos előadás sorozatot szervez november 23-25 között, ahol a modern tudományos programozás eszköztárát tekinti át, amelyek hasznosak lehetnek mindenki számára, aki tudományos célú szimulációkat fejleszt, vagy nagy teljesítményű számításokban érdekelt.

Kifejezetten ajánlottak az előadások azoknak, akik:

  • Aktívan fejlesztenek nagy teljesítményű számításokat, vagy analízis eszközöket
  • Olyan kódokon dolgoznak, ahol fontos a sebesség
  • Többet szeretnének tudni a párhuzamos programozásról
  • Egyetemi hallgatók, akiknek későbbi munkájuk, kutatásuk során a programozás mindennapi eszköz lesz.

Az előadások érdekesek lehetnek azok számára, akik:

  • Interpretált matematikai felületeket használnak, mint például Mathematica, Maple, Matlab, és szeretnék jobban megérteni, hogy ezeknek milyen futásidőben mérhető költségeik vannak
  • Gyakorlott programozók, de szeretnének hallani az újdonságokról és a várható trendekről

További részletek itt.

A Khronos kiadta a SYCL végleges 1.2-es specifikációját

05/26/2015

A Khronos csoport befejezte a GPU-kat célzó, egyetlen forráskódból dolgozó SYCL nyelv 1.2-es változatának specifikációját, amellyel az OpenCL és a C++ előnyei ötvöződnek.

A specifikáció tervezésénél előrelátóan figyelembe vették a C++ nyelv gyors fejlődését, így használhatóak lesznek benne a C++11, 14 sőt a közelgő 17 legújabb eszközei is. Továbbá segítve a C++17-be tervezett Parallel STL specifikáció fejlesztését a Khronos elindított egy nyílt forrású munkát a Parallel STL SYCL alapú implementációjának megvalósítására.

További részletek a Khronos weboldalon érhetőek el.

GPU Nap 2015 - The Future of Many-Core Computing in Science

05/12/2015

Mint minden évben 2010 óta, idén is lesz GPU Nap!

A GPU Labor a Wigner FK támogatásával egy két napos nemzetközi konferenciát szervez a GPUk és Párhuzamos Számítások témakörében Május 20-21 között.

Idén a terület legmeghatározóbb nemzetközi cégeitől (mint NVIDIA, AMD, MICROSOFT és CODEPLAY) jönnek fejlesztők, akik bevezető előadásokban mutatják be a létező és a hamarosan megjelenő programozási felületeket (APIkat), valamint beszélnek a szoftveres és hardveres újdonságokról is.

Kiemelt témakörökben is hallhatunk előadásokat meghívott előadóktól, akik betekintést nyújtanak a heterogén elosztott számítások, a GPU-kkal kapcsolatos virtualizációs megoldások, valamint a statisztikus fizikai alkalmazások körébe.

A további hazai cégek, egyetemek és kutatóintézetek előadásai még szélesebb képet festenek arról, hogy mely ipari vagy épp kutatási területeken sikerült a GPUk számítási teljesítményét kiaknázni.

Az esemény angol nyelvű, ingyenesen látogatható, de regisztrálni kötelező ITT.

Az előzetes időbeosztás már megtekinthető a konferencia weboldalán.

Az NVIDIA új drivere támogatja az OpenCL 1.2-t!

04/14/2015

A napokban elérhetővé vált GeForce 350-12 whql driver GPGPU szemszögből legfontosabb újítása, hogy lehetővé teszi az OpenCL 1.2-es specifikációra íródott programok futtatását is. Az NVIDIA ezzel nagy hátrányt dolgozott le, hiszen ő volt az utolsó nagy gyártó, aki nem támogatta a több, mint 3 éves sztenderdet.

Bővebb információk a driverről itt olvashatóak.

Elkészült az 1.0-s HSA specifikáció

03/19/2015

A HSA konzorcium a napokban jelentette be, hogy befejezte a munkát a HSA 1.0-s változatán, rögzítve ezzel a rendszerarchitektúra, a futtatási környezet és a programozók számára szánt referencia specifikációját.

A munka már folyik a HSA implementációin is, azonban ezek széleskörű alkalmazásaira még várni kell.

További információk és részletek a HSA weboldalán.

A Khronos nagyot újít a grafika és az elosztott számítások terén

03/03/2015

 

A GDC 2015 leginkább várt bejelentése a Khronos Csoporttól érkezett. Az igencsak korosodó és elavult modellje miatt sokat kritizált OpenGL utódja a Vulkan névre hallgat és az AMD Mantle, valamint a Apple Metal API-jához hasonló alacsony szintű hozzáférést biztosít majd a grafikai alkalmazások számára.

Ez azonban csak a jéghegy csúcsa. A Vulkan az AMD Mantle API-jával nagyon szoros viszonyban van, ami nem csoda, hiszen a fejlesztés során rengeteget átvettek az AMD már kidolgozott és a fejlesztők által nagyra értékelt specifikációjából.

A hab a tortán, hogy az AMD megelőlegezi a Vulkan sikerét azzal, hogy a Mantle API-t nem fogja fejleszteni, hanem azt javasolja a fejlesztőknek, hogy a DirectX12 vagy a Vulkan API-jára fejlesszenek a jövőben.

A kilátástalanul bonyolult számítási API versenyben is előremutató lépést tett a Khronos, ugyanis a Vulkan shaderjeit egy új SPIR-V-nek nevezett köztesre lehet majd fordítani, és ez hordozható lesz, valamint használható lesz az OpenCL kernelek reprezentálására is, nem csak a legújabb openCL 2.1, de 1.2-ig visszamenően mindegyik szabványban.

Az új OpenCL 2.1 szabvány újításai között szerepel a kernel nyelv C++14 alapra emelése, valamint a hardveres szálkezelés elérését lehetővé tevő új sub-group műveletek. A bővebb részletek és az előzetes specifikációk a Khronos oldaláról érhetőek el.

A GDC-n elhangzott előadás itt tekinthető meg.

 

Az Intel következő generációs chipjei

02/13/2015

Az Intel bemutatta a Core i család új tagját a Broadwell-U-t!

Érdemes egy pillantást vetni a lapka kialakítására: lehet, hogy a PCI-E-s grafikus bővítőkártyáknak leáldozott, de a párhuzamos programozás és az integrált GPU képességeinek kihasználása még fontosabb, mint eddig valaha!



Szintén idén, az év második felében érkezik az új Skylake architektúra is az Inteltől.
 

A Khronos meghallgatja a fejlesztők véleményét

01/16/2015

A Khronos konzorcium közzé tett egy felmérést, amiben kikérik a fejlesztők véleményét az új OpenGL szabványról.

Akik szeretnének részt venni a felmérésben, azok itt találják azt.

A Samsung átveszi a vezetést 8Gb-tel

01/15/2015

A Samsung bejelentette, hogy a 20nm-es gyártástechnológiával készülő 8Gb-es GDDR5-ös memóriái sorozatgyártásba kerültek.

Az új chip nemcsak 4-szer nagyobb sávszélességgel bír csatornánként, mint DDR3-as társai, hanem kevesebb is elegendő belőlük ugyanannyi memóriához, ami csökkentheti a kivezetések számát, ami a nyomtatott áramköri lapot is tovább egyszerűsíti, csökkentve a gyártási költségeket.

A Micron is bejelentette hasonló paraméterekkel bíró saját megoldásait, amiket egyelőre a két piacvezető partnereinek szán, amivel valószínűleg az AMD és Nvidia kettesfogatára gondol.

OpenACC 2.0 kóddal gazdagodott a GCC 5

01/15/2015

Az OpenACC támogatás a GCC fordítócsomagban továbbra is kisérletinek minősített, mivel még nem minden szükséges kódrészlet került a helyére, azonban a 2.0-ás verzió támogatása jó úton halad.

Akik szeretnének első kézből értesülni, itt olvashatnak bővebb információkat.

CUDA 7

01/13/2015

Az Nvidia kiadta a CUDA fejlesztői környezetének 7-es verzióját.

Olyan fontos képességekkel gazdagodott a fejlesztői környezet, mint egyes C++11-es nyelvi újítások használata GPU kódban, például az "auto" kulcsszó használata, a range-alapú for ciklusok, vagy a lamdbda kifejezések. Az STL-szerű Thrust könyvtár is kapott újításokat, többek között most már lehetőség nyílik algoritmusokat indítani __device__ dekorált kódból. Egy új könyvtár is tiszteletét teszi, mégpedig a cuSOLVER, ami LAPACK-szerű sűrű és ritka mátrixra vezető diffegyenlet megoldók gyűjteménye. Továbbá még egy könyvtár került kiadásra ebben a verzióban, mégpedig az nvrtc, ami futás-idejű kódgenerálást tesz lehetővé, amivel még jobban optimalizálhatók a programok futtatás közben.

További információkért látogasson el ide.

Rust 1.0 Alfa

01/09/2015

A Mozilla gondozásában született biztonság- és teljesítménycentrikus nyelvet a fejlesztői kellően érettnek tekintik, hogy kiadják az 1.0-ás verzió alfa változatát.

A rustc fordító (amelyet természetesen rustban írnak) az első a nyelv specifikációját követő fordító, amely a tervek szerint február 16-án kap egy béta kiadást. Ezután a lehető legkevesebb béta kiadása mellett szeretnék a fejlesztők elérni a végleges verziót, amelynek megvan minden esélye, hogy felvegye a versenyt napjaink vezető teljesítménycentrikus nyelvével, a C++-szal.

Azok, akik szeretnének közelebbről megismerkedni ezzel az új nyelvvel, látogassanak el a Rust honlapjára.

Xeon Phi útiterv

11/23/2014

Az Intel leleplezte a Xeon Phi jövőjét.

Ismert volt jó ideje, hogy az Intel Phi processzorok következő generációja akár 72 darab x86-os magban is bővelkedhet, valamint 4 szállal és két 512 bites ALU-val magonként, 36 PCI-E 3.0-ás csatolóval és maximum 384 GB DDR4-es memóriával. Az Intel azonban csak most nyilatkozott ezekről a tervekről és a későbbi tervezett termékekről.

Az új generációs Many Integrated Core Architektúra (MIC) chipjei, amelyek a Knights Landing névre hallgatnak 2015 második felében érkezhetnek meg 14 nm-es technológiával gyártva, míg a későbbi Knights Hill nevű változatok valamikor 2017-re várhatóak a még kisebb, 10 nm-es csíkszélességgel. Az Intel továbbra is kitart az Omni-Path architektúrája mellett. Ez az Infiniband versenytárs a Knights Landing-al együtt fog érkezni és maximum 48 porttal (a versenytárs 36-jával szemben) fog rendelkezni, vezetékenként akár 100 Gbps sebességgel és a Mellanox-énál akár 58%-al kisebb késleltetéssel.

OpenCL 2.0 & SYCL 1.2 frissítések

11/18/2014

A Khronos kiadott egy új frissítést az OpenCL 2.0-hoz, tisztázva néhány félreérthető pontot a specifikációban, illetve behozva néhány új kiterjesztést, valamint az OpenCL-t valódi C++-á absztraháló SYCL 1.2-es specifikációja is jelentős változtatásokon esett át, tükrözve a C++-ba és az STL-be tervezett párhuzamos programozási fejlesztéseket.

A hivatalos bejelentésről itt találhatóak további részletek.

A legerősebb: Nvidia Tesla K80

11/18/2014

Az NVIDIA bemutatta az eddigi legerősebb dupla-GPU-s rendszerét: a Tesla K80-at.

Az új bestiában 2 darab GK210-es chip foglal helyet, ami összesen 4992 CUDA magot jelent. Ezekkel 8,74 és 2,91 TFlops teljesítmény érhető el, rendre egyszeres és dupla pontosság esetén. Ha ez nem volna elég, akkor az i-re a pontot a 24 GB GDDR5-ös memória teszi fel, ami 384-bit széles csatornán csatlakozik a chiphez 5 GHz effektív órajel mellett.

Az Tesla K80-as új chipje nem csak őrületesen nagy számítási kapacitással bír, de az SMX regiszterek számát is megduplázza a korábbi 256 KB-ról 512 KB-ra, illetve a megosztott memóriát 64 KB-ról 128 KB-ra.

Az AMD HSA futtatási környezete nyílt forrású lett

11/13/2014

Az AMD nagy lökést adott a HSA elterjedésének.

Bár a HSA fordító láncnak a legtöbb része eddig is nyílt volt, az AMD most megtette a végső lépést azzal, hogy a HSA futtatókörnyezetének forrását is megnyitotta. Ezzel bárki előtt megnyílik a lehetőség, hogy a saját fordító láncát felépítse, prototípusként használva az AMD implementációját. A korábbi fejlesztések, mint az AMD GPU LLVM modulja, és a nemrég nyilvánosságra hozott 'AMDKFD' HSA rendszermag modul várhatóan hamarosan bekerül a 3.20-as linux kernelbe, amivel teljessé válik a felhasználótér-beli HSA lánc.

Sajnos a HSA megérkezése a Windows platformon még várat magára.

Megérkezett a C++14!

08/18/2014

A nagy teljesítményű számítások mostantól egyszerűbbé válnak a C++14 segítségével.

A múlt évtized valószínűleg legelterjedtebb számítási nyelve úgy tűnik, végre utoléri modernebb társait. A 2011-ben elfogadott C++11 szabvány elterjedése után az új változat hiányosságokat pótol, és hasznos új elemekkel bővül mind nyelvi eszközök, mind a standard könyvtárak terén, készen állva az új kihívásokra.

A Clang új verziói már támogatják is a C++14-es kiterjesztéseket és hamarosan a GCC-is eléri ezt a célt a 5.0-ás verzióval. A Microsoft némileg le van maradva a Visual Studio új 2015-ös változatában is, még nem támogat néhány C++11-es elemet sem, de a legfontosabb újítások megvannak benne, és hamarosan érkeznek a továbbiak is.

Jelenleg a C++17-es változat áll sztenderdizálás alatt, ami hasonlóan nagy változásokat hoz majd, mint amilyeneket a C++11 hozott a C++98-al szemben.

Még több információ a nyelvről 2014 végi állapotáról itt.

SIGGRAPH 2014

2014/08/10

Ma nyitotta meg kapuit a SIGGRAPH 2014 konferencia és kiállítás Vancouverben.

Nyilván sokan várták az idei Siggraph-ot, amely mint minden évben, idén is felvonultatja a számítógépes grafika legújabb eredményeit, mind hardver, mind szoftver téren. Több Inteles előadás is a cég OpenCL-es kutatásairól fog szólni, bár kétség kívül az egyik legizgalmasabbnak ígérkező nap a Khronos Konzorcium előadásait tömörítő nap lesz.

A nyílt szabványok zászlajait lobogtató konzorcium beszél majd a WebCL aktuális fejlesztéseiről, az OpenVX képfeldolgozó könyvtárcsomagról, és a SYCL legújabb fejleményeiről. Ami viszont ezeknél is nagyobb érdeklődésre tarthat számot, az a Microsoft DirectX 12, az AMD Mantle és az Apple Metal API-jainak kereszttüzében őrlődő Khronos szabvány, az OpenGL következő iterációja. Az OpenGL 5 néven emlegetett revíziótól mind a játékipar, mind a professzionális felhasználók igen sokat várnak, így nem lesz egyszerű feladat megfelelni az elvárásoknak.

FirePro S9050 & S9150

2014/08/07

Bő egy hónappal a munkaállomásokba szánt W8100 variáns után megérkezett a passzív hűtésű, szerverekbe szánt FirePro sorozat két legújabb tagja.

Az S9050 és S9150 rendre 1792/2816 árnyalóval, 12/16 GB GDDR5 memóriával, 264/320 GB/sec memória sávszélességgel, 3,23/5,07 GFlop egyszeres, valamint 0,81/2,53 GFlop kétszeres számítási teljesítményt tudnak felmutatni.

Linux rendszermag tapasz HSA driverhez

2014/07/11

Az AMD a napokban tette elérhetővé azt a 83 tapaszból álló csomagot, amely HSA (Heterogenous System Architecture) felületen is elérhetővé teszi saját CPU/APU/GPU termékeit.

A tapaszok referencia implementáció gyanánt is szolgálnak más gyártók számára, akik szeretnének saját HSA drivert írni hardvereikhez. A tapaszok segítségével a nyílt forrású driverek is profitálhatnak a hamarosan érkező OpenCL 2.0 leghasznosabb képességeiből: a megosztott virtuális memóriából, valamint a platform-szintű atomi utasításokból.

Leghamarabb a 3.17-es kernel verzióban találkozhatunk az új driverrel.

Intel Omni-Scale Fabric v2.0

2014/06/25

A lipcsei ISC-n az Intel sem mulasztotta el felvázolni a HPC szegmenst érintő jövőképüket.

A cég a saját gondozásában fejlődő Omni-Scale fabric következő iterációjáról beszélt. Az Omni-Scale következő verziója binárisan kompatibilis marad elődjével, azonban lényegesen nagyobb hálózati adatátvitelt tesz lehetővé. Természetesen az újdonság egy átfogó hálózati megoldás lesz, amire nyílt forrású menedzsment szoftvert terveznek készíteni.

A vizuális típusú hallgatóság kedvéért készítették az alábbi videót is.

AMD FirePro W8100

2014/06/24

Az AMD bemutatta a munkaállomásokba szánt W9100 zászlóshajója kisebb testvérét.

A friss jövevény a márciusban bemutatott elődjének 5,24/2,62 GFlops-os egyszeres, valamint dupla pontosság melletti teljesítményénél valamivel szerényebb, 4,2/2,1 GFlops számítási teljesítmény felmutatására képes. A hátrányt a cég szerényebb árral, valamint a fogyasztás 275 Wattról 220 Wattra történő mérséklésével igyekszik honorálni.

NVIDIA Tesla ARM támogatás

2014/06/23

A lipcsei International Supercomputing Conference (ISC) alkalmával az NVIDIA bemutatott egy ARM-os környezetben működő Tesla gyorsítót.

Az új fejlesztés olyan platformok építését teszi lehetővé, amiben egy rendkívül alacsony fogyasztású 64-bites gazda gép vezérel egy nálánál nagyságrendekkel erősebb, Tesla sorozatú kártyát. Az új fejlesztés várhatóan a CUDA 6.5-ös fejlesztői csomagjának kiadásával válik széles körben elérhetővé.

Ezek az erőfeszítések képezhetik az NVIDIA komolyabb szerverpiaci törekvéseinek első lépését. Ugyan állításuk szerint egyelőre nem tervezik, hogy a saját Denver architektúrájukat a kiszolgálói piacon is próbára tegyék, az ARM memória címteret támogató videokártyák realizálása mégis ebbe az irányba mutat.

AMD FirePro S4000X pengeszerverekbe

2014/06/20

Az AMD elérhetővé tette partnerei számára az S4000X szerverkörnyezetbe szánt dedikált GPU gyorsítóját.

Az újdonság nem teljesítményével tűnik ki a tömegből, hanem a méretével. Az S4000X MXM formátumot használ, így elméletben notebookokban is megállná a helyét, azonban elsősorban a pengeszerverek piacán igyekszik hódítani. Korántsem példátlan a dedikált kártya egy pengeszerverben, azonban általában az asztali verziók speciális hűtésű változatát szokták használni erre a célra. Az MXM modul teljesítménye mindenképpen szerényebb lesz, mint egy teljes PCI-E bővítőkártyára pakolható versenytársáé, azonban a mérete, kiváltképp a fogyasztása számottevően kedvezőbb, mindössze 45 Watt.

The Future of Many-Core Computing In Science

2014/05/29

Idén új néven kerül megrendezésre az MTA Wigner FK campusán a korábban GPU-Nap névre hallgató rendezvény.

Bár továbbra is célja a konferenciának, hogy a masszívan párhuzamos programozásban jártas kutatók és ipari szereplők megosszák egymással tapasztalataikat, idén több más cél is fókuszba kerül. Egyfelől az "új generációs hardverekként" emlegetett konzolok és más radikálisan újnak mondható hardver megközelítések miatt szeretnénk választ keresni arra, hogy a tudomány számos területén mely szoftveres és hardveres megoldások lehetnek a legalkalmasabbak a tudomány művelésére, valamint szeretnénk egyfajta párbeszédet indukálni az ipar és a tudomány azon szereplői között, akik nem is feltétlenül vannak tisztában avval, mennyire hasonló problémákat boncolnak nap mint nap.

Helyszín: Budapest XII. kerület, Konkoly Thege Miklós út 29-33.

Időpont: 2014. május 29.

Az esemény programja ITT található. A részvételhez kötelező ITT regisztrálni. A belépéshez fényképes igazolvány szükséges.

Java 9 HSA támogatás

2014/04/17

Az AMD a Fedora-val karöltve demonstrálta a Java 9 HSA képességeit a Berlin szerver APU-val.

Mivel az Oracle is tagja a HSA konzorciumnak, így csak idő kérdése volt, mikor manifesztálódik ez a tény a saját gondozásában lévő Java nyelven belül. Ugyan a Java 8-hoz az AMD már fejlesztett egy Aparapi nevű könyvtárat, amely lehetővé tette a programozók számára, hogy parallel számításokat definiáljanak Java szintaxissal, amikből OpenCL kernelek generálódtak. A Java 9 tovább emeli a tétet, és az új lambda függvények segítségével teljesen transzparens módon lehet masszívan párhuzamos számolásokat írni, amikből egyenesen HSA köztes (HSAIL) fordul, így sokkal több lehetőséget biztosít a Java Runtime-nak az optimalizációkra.

Ugyan a Java 9 képes futtatni az Aparapival írt programokat is, igazi erejét az új interfészen keresztül tudja megmutatni. Az új technológia drámaian leegyszerűsíti az üzleti szoftverek gyorsítását az IGP-n keresztül.

CUDA 6

2014/04/16

Ma elérhetővé vált a CUDA SDK 6-os verziója.

Az SDK talán legfontosabb újítása a Unified Memory (korábban UVA, avagy Unified Virtual Addressing), amely egy olyan memória névtér, amelyben minden memória mozgatás implicit, és a CUDA Runtime felügyeli. Amennyiben a hardver képes fizikailag megosztani a memóriáját a gazda folyamattal (NVIDIA Tegra K1), úgy a runtime teljesen nélkülözi a másolást, míg PCI-E BUS használata mellett az elérhető leggyorsabb címfordítást és másolási módszert választja, a programozó beavatkozása nélkül. Ez a technológia szolgálhatna az OpenCL 2.0 szabvány SVM (Shared Virtual Memory) képességének alapjául.

További újítás a cuBLAS és cuFFT könyvtárak teljesítményének automatikus skálázódása multi-GPU környezetekben, míg elérhetővé vált egy a CPU-s BLAS könyvtárakkal binárisan kompatibilis nvBLAS könyvtár is, amely zéró kód módosítással képes kamatoztatni a GPU-k teljesítményét BLAS számolásokban.

Az újításokról bővebben ebben a blog bejegyzésben lehet olvasni.

// BUILD /

2014/04/02

A héten kerül megrendezésre a Microsoft legrangosabb konfereciája, idén Build 2014 néven.

A konferencia témája elsődlegesen a Windows 8.1 operációs rendszer első nagy frissítése (Update 1), a rövidesen érkező Windows Phone 8.1 rendszerfrissítés, valamint a DirectX 12 és az ezekhez kapcsolódó szolgáltatások, úgymint az új alkalmazásbolt, a közös kódbázison alapuló, telefonon, táblagépen és asztali gépeken azonos formában elérhető Office kliens, és még sok más programról esik szó.

Aki élőben kívánja követni a konferencia eseményeit, megteheti a channel9 oldalán.

NVLink, Stacked RAM

2014/03/25

A 2014-es GPU Tech Conference alkalmával bemutatásra került az NVLink BUS technológia, amely az NVIDIA válasza a HPC szegmens egyre növekvő sávszélesség igényére.

A technológia lényege egy olyan eszközök között húzódó felület, amely a PCI-E BUS rendszerének egy alternatívája, amely sokkal nagyobb átviteli sebességeket ígér, mint a manapság legfejlettebnek mondható PCI-E 3.0-ás szabvány. A tervek szerint a CPU oldaláról az eszközök felé továbbra is csak a PCI-E BUS áll rendelkezésre, azonban az eszközök egymás között az NVLinken keresztül is kommunikálhatnának, mindezt a PCI-E 3.0 tempójának 5-12-szerese mellett, ami így az elméleti 80-200 GB/s sávszélességet ostromolja.

A konferencián továbbá részletezték, miként kívánják a memória sávszélességet az eszközök oldalán is növelni. Ez utóbbit az ún. rétegzett memória (Stacked memory) alkalmazásával kívánják elérni. Ez lényegében annyit tesz, hogy ezentúl nem 1 rétegből fog állni a memória chip, hanem egymásra rétegzik azokat, és vertikális irányban történik a kiolvasás, egyszerre több cella értékét megkapva.

A technológiákról bővebben egy blogbejegyzésben lehet olvasni.

SYCL előzetes specifikáció

2014/03/19

A Khronos konzorcium kiadta a SYCL (ejtsd: szikl, az angol sickle szó után, ami a SPIR (ejtsd: szpír, az angol spear szó után) mintáját kívánja követni) előzetes specifikációját, hogy a fejlesztők visszajelzéseikkel javíthassák azt, mielőtt a véglegesítenék a szabványt.

A SYCL egy template könyvtár, és egy referencia fordító, amelyek az OpenCL szabvány köré és a C++11, mint gazda- és eszközoldali nyelv köré épülnek. A szabvány célja az OpenCL alkalmasabbá tétele magasabb szintű könyvtárak fejlesztésére, un. single-source módon, ahol a gazda- és eszközoldali kód egy forrásfájlban található. Az új szabvány rögtön az 1.2-es verziószámot kapta, így jelezve, mely alatta lévő OpenCL verziót teszi elérhetővé. A SYCL használatával a programozók képesek lesznek fejlett C++ technikákat használni kernel nyelven belül is, a lehető legminimálisabb megszorításokkal, amelyek továbbra is a GPU architektúrák képességeinek közös metszetéből adódnak.

Az előzetes specifikáció itt tekinthető meg, míg a bemutatón tartott előadás fóliái itt tekinthetők meg.

GDC 2014

2014/03/17

Idén is megrendezésre kerül a GDC (Game Developers Conference), a világ legrangosabb játékfejlesztői konferenciája, ahol a legnagyobb stúdiók demózzák új játékaikat és játékmotorjaikat, továbbá a hardver- és szoftvergyártók is tiszteletüket teszik, hogy bemutathassák legújabb technológiáikat a fejlesztőknek, és a nagyérdeműnek.

Az idei konferencián számos érdekes technológia kerül demózásra, így amint napfényre kerülnek a részletek, a GPU-Labor virtuális hasábjain is beszámolok a tudományos szempontból is releváns hírekről. Egészen biztosan érdemes lesz a napokban visszalátogatni az oldalra.

GeForce 800M színre lép

2014/03/14

Az NVIDIA útnak indította legújabb, a 800-as szériába tartozó notebook videokártya családját. A jövevények között vegyesen találunk új Maxwell architektúrás példányokat, valamint a régebbi Kepler architektúrával bíró darabokat is. Az újdonságok mind 28 nm-es csíkszélességgel készülnek, ami abból adódik, hogy a vezető félvezetőgyártó TSMC-nél elhúzódott a 20 nm-es gyártósorok csatasorba állítása.

Nem teljesen tiszta, miért keverdnek az architektúrák egy családon belül, mi több, a GTX 860M elnevezése ellenére egyaránt takarhat GK104, valamint GM107 típusú chipet, ami különbözőséget koránt sem triviális, miképp lehet feltüntetni a végfelhasználó számára egyáltalán. Az azonban rögtön szembetűnhet, hogy a legfelső kategóriás termékek azok, amik továbbra is a Kepler architektúrát alkalmazzák. Egyes spekulánsok arra következtetnek ebből, hogy bizonyára az új architektúrát először az alsó és közép-kategóriában kívánta a gyártó letesztelni, mire a 20 nm-es gyártósorok elkészülnek, amikor bevetésre kerülhet a presztízsnek számító csúcs-kategóriában is, minden bizonnyal még az idei év folyamán.

AVX-512 támogatás GCC 4.9-ben

2014/02/10

Egy friss GCC tapasz AVX-512 utasításkészlet támogatással látja el a fordítót, még az előtt felkészítve ezzel a fordítót az architektúra támogatására, mielőtt az első hardverek megjelennének, amik támogatnák azt. Az AVX-512 utasításkészlet az Intel Knight's Landing architektúrájú Phi gyorsítóin debütál, majd vélhetően 2015 végén az asztali és mobil processzorokban is tiszteletét teszi a Skylake kódnevű processzorcsalád érkezésével.

OpenCL SPIR 1.2

2014/01/21

A Khronos konzorcium kiadta az OpenCL SPIR specifikációjának 1.2-es verzióját. A SPIR (Standard Portable Intermediate Representation) nyelv célja egy olyan köztes nyelv megteremtése, amely kellően távol áll a forráskódtól ahhoz, hogy emberi fogyasztásra alkalmatlan legyen, ugyanakkor még nem tartalmaz semmilyen architektúrafüggő optimalizálást. A köztes nyelv alapjául valamennyi OpenCL-ben érdekelt gyártó által elfogadott LLVM IL (Intermediate Language) áll.

Ugyan a SPIR specifikáció nem szabványosítja a SPIR kód generálásának módját, így elméletben a gyártók készíthetnek olyan SPIR fordítókat, ami a saját compilerüknek kedvez, azonban a Khronos kiadja a SPIR fordító egy referncia implementációját, amit szabadon felhasználhatnak az érdekeltek.

Az új LLVM-közeli köztes lehetővé teszi belátható időn belül OpenCL SPIR generátorok írását, amik más párhuzamos nyelvekből képesek OpenCL-kompatibilis köztest fordítani. (Pl. CUDA >> SPIR, C++AMP >> SPIR, OpenACC >> SPIR, stb.)

Forrás

CES 2014

2014/01/13

Idén januárban is megrendezésre került a szokásos elektronikai évnyitó dzsembori Las Vegasban, - a Computer Electronics Show - ahol az IT világ konzumer piaci krémje felvonultatja az idei évben piacra kerülő termékeit, valamint bemutatja új, hajmeresztőbbnél hajmeresztőbb tanulmányait.

Rövid beszámoló itt olvasható.

A migrálás befejeződött

2013/10/25

A 14-es gépterem felújítását követően a gépek megkapták végső helyüket, a korábbi GPU-s tesztgépek is átkerültek melléjük. Valamennyi gép új operációs rendszert kapott és csomagfrissítést a bináris kompatibilitás jegyében.

A klaszter további fejlesztés alatt áll, azonban ez idő alatt zavartalanul használható. A fejlesztések elsősorban a hálózat sebességnövelését célozzák. A labor gépein telephelyi Kerberos autentikáció működik, valamint központi AFS home könyvtárak. Account igényléshez a labor rendszergazdáihoz lehet folyamodni (e-mail a Rólunk szekcióban), valamint a gépek használatának módjáról a Labor menüpont alatt lehet bővebben olvasni.

GPU-Nap 2013

2013/06/05gpu

Immáron negyedszerre kerül megrendezésre intézetünkben a GPU-Nap című előadássorozat, amely a hazai fizika területén elért masszívan párhuzamos módon számolt numerikus eredményeket prezentálja az érdeklődő közönség számára. Az előadók között találhatók egyetemi kutatók, helyi intézeti kutatók valamint magáncégek is képviseltetik magukat.

Helyszín: Budapest XII. kerület, Konkoly Thege Miklós út 29-33.

Időpont: 2013. június 20.

A nap előzetes programja itt található.

Nagy-Egri Máté Ferenc © 2014