PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL
- Ocena:
- Bądź pierwszym, który oceni ten kurs
- Wersja:
- Online
- Czas trwania:
- 03:50:54
- Technologia:
- JupyterLab, Python 3.10, PySpark 3.4
+ gratis
Kupując ten produkt dodatkowo otrzymasz:
Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji ( ebook )
Opis kursu video PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL
Obierz kurs na... pracę z dużymi zbiorami danych
Czy znane są Ci nazwy Apache Spark i PySpark? Jeśli pracujesz z danymi i do tej pory nie poznałeś tej technologii, najwyższy czas to nadrobić - na przykład w trakcie proponowanego przez nas szkolenia wideo. Apache Spark to otwarta platforma programistyczna służąca do obliczeń rozproszonych. Opracowana i rozwijana początkowo na Uniwersytecie Kalifornijskim, dziś zarządzana przez Apache Software Foundation, świetnie nadaje się do analizy dużych zbiorów danych. Jej interfejs API, znany jako PySpark, skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData.
W ostatnich latach PySpark stał się najpopularniejszym narzędziem służącym przetwarzaniu danych; może swobodnie zastąpić w tym zakresie SQL czy biblioteki pandas/numpy. Ze Sparka korzystają między innymi Databricks, DeepNote czy JupyterLab. Szczególną cechą i zaletą tego rozwiązania jest to, że umożliwia ono przetwarzanie danych w sposób rozproszony. Nasz kurs pozwala zdobyć bazową wiedzę z zakresu pracy z danymi za pomocą Apache Spark (PySpark). W jego trakcie będziemy przygotowywać dane, selekcjonować je, sortować, agregować, łączyć i grupować, a także stworzymy własne funkcje do mapowania ich i nauczymy się zapisywać je do pliku.
Co Cię czeka podczas naszego profesjonalnego szkolenia
W ramach nauki z proponowanym przez nas kursem między innymi:
- Skonfigurujesz środowisko pracy
- Dowiesz się, czym jest SparkSession i jak ją uruchomić
- Stworzysz podstawową DataFrame
- Dokonasz selekcję danych i je posortujesz
- Zbudujesz schemat dla danych
- Poznasz podstawowe operacje związane z agregacją danych i łączeniem zbiorów w jeden
- Przetransformujesz dane za pomocą takich metod jak konkatenacja, rzutowanie czy explode
- Wykreujesz własne funkcje dla PySpark
- Wykonasz mapowanie
- Zapiszesz dane i odczytasz je z pliku - także w formacie parquet
PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL kończy się na poziomie podstawowym. Otrzymana wiedza pozwoli Ci na samodzielne tworzenie pierwszych procesów związanych z transformacją i przetwarzaniem danych. Ułatwi Ci również ich mapowanie i zmianę typów danych. Po ukończeniu szkolenia bez problemu przygotujesz zadania z zakresu ETL.
Apache Spark
Apache Spark jest silnikiem zbudowanym specjalnie w celu przetwarzania danych. Został wyposażony w całą masę służących do tego bibliotek. Co ważne, dane w Sparku można przetwarzać równolegle, co stało się jednym z powodów, dla których technologia ta zdominowała świat big data. Apache Spark obsługuje wiele języków programowania, takich jak SQL, Scala, Python czy R, i pozwala rozwiązywać problemy na różne sposoby z zastosowaniem SQL, transmisji danych i uczenia maszynowego. Przydaje się wszędzie tam, gdzie ilość danych, które wymagają przetworzenia, przekracza możliwości tradycyjnych narzędzi.
Wybrane bestsellery
-
Pytest – nowoczesny framework do uruchamiania testów automatycznych w języku Python. Można używać tej platformy do przeprowadzania testów jednostkowych, ale sprawdzi się świetnie także podczas konstruowania rozbudowanych testów wyższego poziomu (integracyjnych, end-to-end) dla całych aplikacji czy bibliotek. Z Pytestu do testowania kodu korzystają
(39,90 zł najniższa cena z 30 dni)
59.59 zł
149.00 zł (-60%) -
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania z nich konstruktywnych wniosków daje przewagę konkurencyjną
(62,55 zł najniższa cena z 30 dni)
97.29 zł
139.00 zł (-30%) -
Oprogramowanie Apache Kafka powstało jako broker wiadomości w LinkedIn. Obecnie pełni funkcję rozproszonego systemu przetwarzania strumieniowego danych, używanego do budowania aplikacji opracowujących duże ilości danych w czasie rzeczywistym. Z zalet tego oprogramowania korzystają firmy na całym świecie – jest kluczowym narzędziem w takich sektorac
(35,60 zł najniższa cena z 30 dni)
35.60 zł
89.00 zł (-60%) -
Czy zastanawiasz się czasem nad tym, jak to możliwe, że jesteśmy w stanie „rozmawiać” z maszynami? Że coś mówimy, a one nas rozumieją i odpowiadają na nasze pytania, realizują polecenia, wykonują zadania? I na odwrót – to one mówią (i piszą) do nas słowami, które są dla nas jasne? Przetwarzaniem języka naturalnego (ang. natural language processing,
(52,15 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Jednym z obszarów, w które AI wkracza coraz śmielej, jest programowanie. Tam, gdzie pracuje się z liczbami, kodem i algorytmami, pomoc sztucznej inteligencji okazuje się nieoceniona. Jak ją zaprosić do współpracy? Tego dowiesz się z naszego kursu. Jego tematyka obejmuje bowiem programowanie z wykorzystaniem takich narzędzi jak ChatGPT czy GitHub Co
(39,90 zł najniższa cena z 30 dni)
67.60 zł
169.00 zł (-60%) -
API to akronim pochodzącego z języka angielskiego terminu application programming interface, co tłumaczy się jako interfejs programowania aplikacji. W praktyce to zestaw zasad i protokołów, które pozwalają różnym programom komunikować się ze sobą. API może być używane do integrowania różnych systemów, a także do dostępu do funkcji lub danych w okre
(52,15 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Obierz kurs na... legalne pozyskiwanie tajnych informacji Czy znasz termin OSINT? Jeśli nie, wyjaśniamy: OSINT to akronim angielskiego wyrażenia open-source intelligence, czyli... białego wywiadu. Oznacza legalną formę pozyskiwania informacji gospodarczych z rozmaitych źródeł – od środków masowego przekazu aż po social media. W informatyce używa si
(24,75 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł (-30%) -
Szkolenie dotyczy sieci VPN opartych na OpenVPN i Wireguard, a także tematów związanych z intranetem, protokołem TLS i DNS. Pozwala na zdobycie wiedzy i umiejętności potrzebnych do tworzenia bezpiecznych połączeń sieciowych i ochrony prywatności. Omawiane narzędzia, takie jak OpenVPN i Wireguard, są popularnymi protokołami VPN, oferującymi zaawanso
(44,55 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł (-30%) -
PowerShell to zaawansowany interpreter poleceń oparty na środowisku programistycznym .NET Framework. Jest preferowanym narzędziem do kontrolowania i zarządzania środowiskiem Windows i Azure. W przeciwieństwie do większości powłok, które operują na łańcuchach znaków, PowerShell wykorzystuje obiekty. Takie rozwiązanie oferuje zupełnie nowe możliwości
(92,95 zł najniższa cena z 30 dni)
67.60 zł
169.00 zł (-60%) -
Linux z roku na rok zyskuje coraz większą popularność. Uniksopodobne systemy operacyjne bazujące na linuksowym jądrze funkcjonują praktycznie w każdej średniej i większej organizacji, a także - tu już niemal obowiązkowo - w przedsiębiorstwach wyspecjalizowanych w działalności informatycznej, niezależnie od ich wielkości. A że firm przybywa, przybyw
(47,60 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł (-40%)
O autorze kursu video
Piotr Chudzik - absolwent Politechniki Łódzkiej, jego specjalizacja zawodowa to technologie big data oraz administracja nowoczesnymi środowiskami IT (wykorzystującymi między innymi cloud computing, konteneryzację czy IaC - infrastructure as code). Pracuje jako wykładowca na Uniwersytecie Łódzkim, gdzie przekazuje studentom wiedzę na temat Linuksa, baz danych i programowania w języku Python. Jest również trenerem w Software Development Academy. Na co dzień zatrudniony jako menadżer techniczny w dużym zagranicznym banku, odpowiada za prawidłowe i nieprzerwane działanie aplikacji opartych na Google Cloud Platform. Zawsze otwarty na nowe doświadczenia oraz wiedzę, którą w przyszłości mógłby się podzielić z innymi. Interesuje się grami komputerowymi, światem nowych technologii i fantastyką. Jest fanem serii Wiedźmin i uniwersum Warhammera.
Sukces wymaga wcześniejszego przygotowania, bez niego z pewnością osiągniemy porażkę.
Konfucjusz
Piotr Chudzik - pozostałe kursy
-
Kurs video, który dziś proponujemy, skupia się na kwestii podatności Pythona na automatyzację. Pokażemy, jak zaoszczędzić czas dzięki efektywnemu programowaniu z wykorzystaniem najlepszych technik. Dobrze, by słuchacz przed przystąpieniem do szkolenia posiadał już pewną znajomość Pythona w zakresie podstawowych typów danych, zmiennych, pętli, instr
(52,15 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Powiedzieć, że Python jest jednym z najpopularniejszych języków programowania, to nic nie powiedzieć. Doceniają go i od lat wybierają developerzy na całym świecie. Oni go także rozwijają. Ten język programowania wysokiego poziomu jest bowiem dostępny jako projekt typu open source, z błogosławieństwem Python Software Foundation, by udoskonalać Pytho
(69,65 zł najniższa cena z 30 dni)
69.65 zł
199.00 zł (-65%) -
Jeśli pracujesz lub będziesz pracować na danych, prędzej czy później zetkniesz się z akronimem ETL. ETL, czyli wyodrębnianie, przekształcanie i ładowanie, jest procesem powszechnie stosowanym przez organizacje gromadzące i łączące dane z wielu źródeł w celu wspomagania zadań wykrywania, raportowania, analizowania i podejmowania decyzji. Apache Airf
(76,05 zł najniższa cena z 30 dni)
59.15 zł
169.00 zł (-65%) -
Platforma Docker znacznie ułatwiła życie programistom. Dzięki niej zarówno program, jak i jego zależności, takie jak biblioteki, pliki konfiguracyjne czy lokalne bazy danych, można umieścić w lekkim, przenośnym wirtualnym kontenerze, uruchamialnym na praktycznie każdym serwerze z systemem pracującym na jądrze Linux. Nic więc dziwnego, że Docker sta
(58,04 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł (-40%) -
Statycznie typowany język programowania Scala charakteryzuje się między innymi tym, że wspiera zarówno programowanie funkcyjne, jak i obiektowe. Co więcej, Scala jest językiem wieloplatformowym – działa na maszynie wirtualnej Javy i platformie .NET. W najnowszej wersji (3) składnia Scali mocno zbliża się do składni Pythona i równocześnie dzieli bib
(51,60 zł najniższa cena z 30 dni)
45.15 zł
129.00 zł (-65%) -
Jeśli jesteś programistą, na przykład pracujesz jako specjalista w dziedzinie DevOps i do Twoich zadań należy między innymi utrzymanie środowiska produkcyjnego – także z użyciem rozwiązań chmurowych – nazwa Kubernetes z pewnością nie jest Ci obca. Przypomnijmy jednak dla porządku: zyskujący popularność na całym świecie Kubernetes (zwany także K8s)
(58,04 zł najniższa cena z 30 dni)
90.29 zł
129.00 zł (-30%) -
Konteneryzacja jest alternatywą dla wirtualizacji. W pracy z nowo wdrażanymi, testowanymi czy usprawnianymi aplikacjami pozwala ograniczyć wykorzystanie zasobów i uruchamiać niezależnie wiele aplikacji na jednej maszynie. Kontenery są od siebie całkowicie odizolowane, nic o sobie nawzajem nie „wiedzą”, każdy zawiera własne środowisko. I właśnie ze
(59,59 zł najniższa cena z 30 dni)
89.40 zł
149.00 zł (-40%) -
Na szczęście Docker należy do tych technologii, w które łatwo się wdrożyć. Zresztą istnieje sporo szkoleń, kursów i książek dla początkujących użytkowników tego oprogramowania. Gorzej z opracowaniami na temat zaawansowanej obsługi Dockera. Tymczasem oferuje on wiele narzędzi i sztuczek, których znajomość pozwala przyspieszyć i ułatwić realizację za
(58,04 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł (-40%) -
Kto się decyduje na karierę programisty, musi wybrać swój „ulubiony” język. Ten, w którym będzie się specjalizować, doskonalić, pracować. Oczywiście nie musi to być jeden jedyny język. Chodzi po prostu o język pierwszego wyboru, w którego zakresie będzie się ekspertem. Wielu programistów wybiera do tej roli Javę, czyniąc ją tym samym jednym z najpo
(67,60 zł najniższa cena z 30 dni)
59.15 zł
169.00 zł (-65%) -
Umiejętność zarządzania bazami danych z roku na rok jest coraz bardziej ceniona. Nic w tym dziwnego - ilość danych, jakimi dysponujemy, a które musimy gdzieś przechowywać, sortować, zestawiać ze sobą i z których chcemy wyciągać ważne dla siebie informacje, stale rośnie. Stąd firmy szczególnie wypatrują specjalistów, którzy potrafią to robić - poszu
(49,05 zł najniższa cena z 30 dni)
54.50 zł
109.00 zł (-50%)
Spis lekcji (odkodowane lekcje)
Kurs Video "PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły kursu
- Ilość lekcji:
- 38
- Czas trwania:
- 3 godz. 50 min.
- Format:
- Online
- Data aktualizacji:
- 2023-10-10
- ISBN :
- 978-83-289-0401-9, 9788328904019
- Numer z katalogu:
- 214833
- Do kursu dołączone są materiały dodatkowe, znajdziesz je w Twojej Bibliotece
- Kategorie:
Programowanie » Python
Big Data » Wizualizacja danych
Data Science » Analiza danych
Videopoint - inne kursy
-
Windows Server 2022 to sieciowy system operacyjny stworzony przez Microsoft. Został zaprojektowany z myślą o obsłudze dużych sieci komputerowych i infrastruktur IT. Jego popularność ciągle rośnie, szczególnie w zastosowaniach sieciowych jako serwery lokalne i serwery usług, takich jak WWW, FTP, chmura, DHCP, DNS, VPN, Print Server czy Hyper-V. Jest
(121,14 zł najniższa cena z 30 dni)
119.20 zł
149.00 zł (-20%) -
W świecie przepełnionym informacjami doskonała baza danych, która pozwala na ich zbieranie, organizowanie i zarządzanie nimi, to podstawa sprawnego funkcjonowania każdego przedsiębiorstwa. W tej branży od lat prym wiedzie relacyjna baza danych Oracle. Jednak aby efektywnie korzystać z jej dobrodziejstw, trzeba znaleźć z nią wspólny język. Tym język
(80,49 zł najniższa cena z 30 dni)
79.20 zł
99.00 zł (-20%) -
Automatyzacja pozwala na zwiększenie efektywności poprzez eliminację rutynowych zadań. Wiedząc o tym, firmy chętnie wdrażają automatyzację. Te, które jeszcze tego nie robią, tracą czas i pieniądze. Raporty nie pozostawiają złudzeń: według McKinsey & Company 57% firm już korzysta z automatyzacji AI, a do 2025 roku liczba ta ma wzrosnąć do 85%. Dzięk
(71,55 zł najniższa cena z 30 dni)
127.19 zł
159.00 zł (-20%) -
W dynamicznie zmieniającym się świecie biznesu automatyzacja procesów staje się kluczowym elementem sukcesu każdej organizacji. Technologia RPA (ang. robotic process automation) w połączeniu z zarządzaniem projektami i inżynierią oprogramowania tworzy nowy standard w zarządzaniu zasobami i operacjami firmowymi. I tu wkracza Microsoft Power Automate
(49,05 zł najniższa cena z 30 dni)
87.19 zł
109.00 zł (-20%) -
Notion, wszechstronne narzędzie do organizacji pracy, znajduje zastosowanie zarówno w sferze zawodowej, jak i prywatnej. Pomysł na jego stworzenie zrodził się z potrzeby dostępu w jednej aplikacji do funkcji i udogodnień oferowanych przez notatniki, bazy danych, kalendarze i menedżery zadań. Połączenie funkcji wielu narzędzi w jednej platformie spr
(39,90 zł najniższa cena z 30 dni)
35.60 zł
89.00 zł (-60%) -
Mówi się, że Scrum Master to lider służebny. Nazwa ta wynika wprost z koncepcji zarządzania, w której lider wspomaga swój zespół, zamiast nad nim dominować. To osoba, która usuwa przeszkody i pomaga zespołowi w stosowaniu zasad Scruma. Scrum to metoda zarządzania projektami, zgodna z manifestem Agile. Opiera się na sprintach – cyklach, podczas któr
(59,59 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Angular został przystosowany przez programistów Google’a do tworzenia złożonych i skalowalnych aplikacji. Dzięki modułowości i wydajności jest wybierany do pisania wymagających aplikacji korporacyjnych i biznesowych. Kod jest zredukowany i zorganizowany modułowo, co zapewnia czytelność i ułatwia pracę nad projektem. Dla tworzenia dynamicznych aplik
(81,95 zł najniższa cena z 30 dni)
119.20 zł
149.00 zł (-20%) -
Marzysz o pracy w IT, która „robi różnicę”? Stanowisko inżyniera sieci wiąże się ze sporą odpowiedzialnością, ponieważ od niego zależy działanie sieci całego przedsiębiorstwa. Tylko co to właściwie znaczy? W praktyce chodzi o prawidłowe funkcjonowanie programów i aplikacji sieciowych, działanie telefonii IP, możliwość tworzenia kopii zapasowych i k
(76,05 zł najniższa cena z 30 dni)
135.20 zł
169.00 zł (-20%) -
Być może masz doskonały pomysł na własną aplikację, a nawet wyobrażasz sobie rzesze korzystających z niej i zadowolonych klientów, jednak pomimo wielkich aspiracji rozbijasz się o szklany sufit wynikający z braku doświadczenia programistycznego. Nie zniechęcaj się! Z pomocą przychodzą narzędzia no-code, niewymagające pisania kodu. Dzięki podejściu
(44,55 zł najniższa cena z 30 dni)
79.20 zł
99.00 zł (-20%) -
Administratorzy sieci komputerowych korzystają z szeregu narzędzi i programów wspomagających ich pracę. Także tych, które automatyzują czynności i przez to czynią zadania administratora prostszymi i mniej angażującymi czasowo niż jeszcze kilka lat temu. Nie zwalnia to jednak osób na tym stanowisku z obowiązku rozumienia, w jaki sposób funkcjonuje s
(49,75 zł najniższa cena z 30 dni)
139.30 zł
199.00 zł (-30%)
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas:
Kurs video
Oceny i opinie klientów: PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL Piotr Chudzik (0) Weryfikacja opinii następuje na podstawie historii zamowień na koncie Użytkownika umiejszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniającej do uzyskania rabatu w ramach Programu Kadr.