Skocz do zawartości

Przeszukaj forum

Pokazywanie wyników dla tagów 'CUDA C'.

  • Szukaj wg tagów

    Wpisz tagi, oddzielając przecinkami.
  • Szukaj wg autora

Typ zawartości


Kategorie forum

  • Elektronika i programowanie
    • Elektronika
    • Arduino i ESP
    • Mikrokontrolery
    • Raspberry Pi
    • Inne komputery jednopłytkowe
    • Układy programowalne
    • Programowanie
    • Zasilanie
  • Artykuły, projekty, DIY
    • Artykuły redakcji (blog)
    • Artykuły użytkowników
    • Projekty - DIY
    • Projekty - DIY roboty
    • Projekty - DIY (mini)
    • Projekty - DIY (początkujący)
    • Projekty - DIY w budowie (worklogi)
    • Wiadomości
  • Pozostałe
    • Oprogramowanie CAD
    • Druk 3D
    • Napędy
    • Mechanika
    • Zawody/Konkursy/Wydarzenia
    • Sprzedam/Kupię/Zamienię/Praca
    • Inne
  • Ogólne
    • Ogłoszenia organizacyjne
    • Dyskusje o FORBOT.pl
    • Na luzie

Kategorie

  • Quizy o elektronice
  • Quizy do kursu elektroniki I
  • Quizy do kursu elektroniki II
  • Quizy do kursów Arduino
  • Quizy do kursu STM32L4
  • Quizy do pozostałych kursów

Szukaj wyników w...

Znajdź wyniki, które zawierają...


Data utworzenia

  • Rozpocznij

    Koniec


Ostatnia aktualizacja

  • Rozpocznij

    Koniec


Filtruj po ilości...

Data dołączenia

  • Rozpocznij

    Koniec


Grupa


Imię


Strona


TempX

Znaleziono 4 wyniki

  1. CUDA na kiju (a nawet GPU) cz 2. Wstęp W poprzedniej części omówiliśmy sobie dlaczego warto wykorzystać procesory graficzne do obliczeń oraz po krótce zapoznaliśmy się z ich budową. W tej części omówimy sobie wszystko to co należy zrobić przed napisaniem programu: podam kilka informacji przydatnych podczas rozważania programu równoległego, przygotujemy środowisko do pisania programu w CUDA C, a następnie przygotujemy podwaliny pod pierwszy program tzn. opracujemy sobie teorię mnożenia macierzy oraz napiszemy prototyp programu na CPU. Gotowi? No to jazda!!! Treść artykułu została usunięta, ponieważ użytkownik publikujący ten poradnik wykorzystał w nim materiały, do których nie posiadał odpowiednich praw. Usunięcie nastąpiło na prośbę autora zapożyczonych materiałów.
  2. CUDA na kiju (a nawet GPU) cz 5. Wstęp W poprzednich częściach naszego cyklu CUDA na kiju działaliśmy bardzo niskopoziomowo tzn. sami tworzyliśmy funkcję jądra definiowaliśmy wymiary bloku itd. Czy zawsze tak trzeba robić? Nie, wszyscy, którzy mieli jakiekolwiek wykłady związane z programowaniem wiedzą (a ci którzy nie mieli zaraz się dowiedzą), że dobry programista to leniwy programista. Zatem jeśli istnieją gotowe biblioteki zawierające funkcję, która pozwala na rozwiązanie postawionego nam problemu to z reguły nie napiszemy tego kodu lepiej niż grupa zawodowych informatyków. Dlatego też w tym artykule sprawdzimy jak z mnożeniem macierzy o wymiarach 1021x1021 poradzi sobie biblioteka CUBLAS. Treść artykułu została usunięta, ponieważ użytkownik publikujący ten poradnik wykorzystał w nim materiały, do których nie posiadał odpowiednich praw. Usunięcie nastąpiło na prośbę autora zapożyczonych materiałów.
  3. CUDA na kiju (a nawet GPU) cz. 4 Wstęp W trzeciej części serii artykułów CUDA na kiju (a nawet GPU) udało nam się stworzyć nasz pierwszy CUDOwny program mnożący macierze. Program działa poprawnie ale (jeszcze) nie grzeszy szybkością o ile rozmiary problemu nie są olbrzymie. W tym artykule spróbujemy go zatem trochę przyśpieszyć. Do celów testowych powrócimy do rozmiaru macierzy 1021x1021. Treść artykułu została usunięta, ponieważ użytkownik publikujący ten poradnik wykorzystał w nim materiały, do których nie posiadał odpowiednich praw. Usunięcie nastąpiło na prośbę autora zapożyczonych materiałów.
  4. CUDA na kiju (a nawet GPU) cz. 3 Wstęp W części drugiej artykułu stworzyliśmy szkielet programu do mnożenia macierzy oraz prototyp funkcji jądra wykonującej iloczyn skalarny wiersza macierzy A i kolumny macierzy B czyli pojedynczy element macierzy wynikowej C. W tym artykule pójdziemy krok dalej to znaczy wreszcie napiszemy program na GPU. Będzie to od nas wymagało zmian w funkcji matmul, wywołującej jądro oraz wewnątrz samego jądra. Rozpoczniemy od najprostszej wersji programu implementując po prostu to co robił program CPU na procesorze graficznym i z czasem będziemy ją sobie komplikować za każdym razem sprawdzając jakie przyspieszenie względem wersji CPU uzyskaliśmy. Nie ma co już dłużej zwlekać. Lecimy z tematem 😊. Treść artykułu została usunięta, ponieważ użytkownik publikujący ten poradnik wykorzystał w nim materiały, do których nie posiadał odpowiednich praw. Usunięcie nastąpiło na prośbę autora zapożyczonych materiałów.
×
×
  • Utwórz nowe...

Ważne informacje

Ta strona używa ciasteczek (cookies), dzięki którym może działać lepiej. Więcej na ten temat znajdziesz w Polityce Prywatności.