
PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL
- Ocena:
- Bądź pierwszym, który oceni ten kurs
- Wersja:
- Online
- Czas trwania:
- 03:50:54
+ gratis
Kupując ten produkt dodatkowo otrzymasz:
Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji ( ebook )
Opis kursu video PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL
Obierz kurs na… pracę z dużymi zbiorami danych
Czy znane są Ci nazwy Apache Spark i PySpark? Jeśli pracujesz z danymi i do tej pory nie poznałeś tej technologii, najwyższy czas to nadrobić – na przykład w trakcie proponowanego przez nas szkolenia wideo. Apache Spark to otwarta platforma programistyczna służąca do obliczeń rozproszonych. Opracowana i rozwijana początkowo na Uniwersytecie Kalifornijskim, dziś zarządzana przez Apache Software Foundation, świetnie nadaje się do analizy dużych zbiorów danych. Jej interfejs API, znany jako PySpark, skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData.
W ostatnich latach PySpark stał się najpopularniejszym narzędziem służącym przetwarzaniu danych; może swobodnie zastąpić w tym zakresie SQL czy biblioteki pandas/numpy. Ze Sparka korzystają między innymi Databricks, DeepNote czy JupyterLab. Szczególną cechą i zaletą tego rozwiązania jest to, że umożliwia ono przetwarzanie danych w sposób rozproszony. Nasz kurs pozwala zdobyć bazową wiedzę z zakresu pracy z danymi za pomocą Apache Spark (PySpark). W jego trakcie będziemy przygotowywać dane, selekcjonować je, sortować, agregować, łączyć i grupować, a także stworzymy własne funkcje do mapowania ich i nauczymy się zapisywać je do pliku.
Co Cię czeka podczas naszego profesjonalnego szkolenia
W ramach nauki z proponowanym przez nas kursem między innymi:
- Skonfigurujesz środowisko pracy
- Dowiesz się, czym jest SparkSession i jak ją uruchomić
- Stworzysz podstawową DataFrame
- Dokonasz selekcję danych i je posortujesz
- Zbudujesz schemat dla danych
- Poznasz podstawowe operacje związane z agregacją danych i łączeniem zbiorów w jeden
- Przetransformujesz dane za pomocą takich metod jak konkatenacja, rzutowanie czy explode
- Wykreujesz własne funkcje dla PySpark
- Wykonasz mapowanie
- Zapiszesz dane i odczytasz je z pliku – także w formacie parquet
PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL kończy się na poziomie podstawowym. Otrzymana wiedza pozwoli Ci na samodzielne tworzenie pierwszych procesów związanych z transformacją i przetwarzaniem danych. Ułatwi Ci również ich mapowanie i zmianę typów danych. Po ukończeniu szkolenia bez problemu przygotujesz zadania z zakresu ETL.
Apache Spark
Apache Spark jest silnikiem zbudowanym specjalnie w celu przetwarzania danych. Został wyposażony w całą masę służących do tego bibliotek. Co ważne, dane w Sparku można przetwarzać równolegle, co stało się jednym z powodów, dla których technologia ta zdominowała świat big data. Apache Spark obsługuje wiele języków programowania, takich jak SQL, Scala, Python czy R, i pozwala rozwiązywać problemy na różne sposoby z zastosowaniem SQL, transmisji danych i uczenia maszynowego. Przydaje się wszędzie tam, gdzie ilość danych, które wymagają przetworzenia, przekracza możliwości tradycyjnych narzędzi.
Wybrane bestsellery
-
Stoisz przed wyborem przedmiotów maturalnych i jako jeden z nich rozważasz informatykę? To będzie świetna decyzja! Bo tu nie chodzi tylko o samą maturę, naprawdę. Zdać ją oczywiście trzeba, i to zdać dobrze – szczególnie jeśli planujesz kontynuować naukę programowania na studiach – ale umiejętność kodowania sama w sobie to jest to! Otworzy Ci nieje
(34,75 zł najniższa cena z 30 dni)
55.60 zł
139.00 zł (-60%) -
Business intelligence (BI) jest procesem przekształcania danych w informacje, a informacji w wiedzę. Ta zaś może zostać wykorzystana do zwiększenia konkurencyjności przedsiębiorstwa. Jeśli wiemy więcej o otoczeniu rynkowym, o konkurentach, dostawcach i klientach, jesteśmy wszak w stanie podejmować decyzje bardziej racjonalne i oparte na faktach. Da
(86,70 zł najniższa cena z 30 dni)
115.60 zł
289.00 zł (-60%) -
Microsoft Excel to arkusz kalkulacyjny o wielkich możliwościach. Jako pionier wśród programów biurowych miał duży wpływ na rozwój dziedziny wizualizacji danych. Jeśli chcesz przedstawić dane w graficznej formie, z dużym prawdopodobieństwem skorzystasz w tym celu właśnie z Excela. Nie potrzebujesz zaawansowanej wiedzy statystycznej, by tworzyć wykre
(69,65 zł najniższa cena z 30 dni)
79.59 zł
199.00 zł (-60%) -
Jeśli zapytać aktywnych specjalistów branży IT o najpopularniejszy obecnie język programowania, większość z nich odpowie bez wahania: Python. Kto zatem rozważa rozpoczęcie kariery jako specjalista DevOps albo jako administrator systemów, zdecydowanie powinien zacząć naukę od opanowania tego języka, ponieważ to w nim przede wszystkim będą operować k
(71,60 zł najniższa cena z 30 dni)
71.60 zł
179.00 zł (-60%) -
Duński fizyk, laureat Nagrody Nobla, zauważył kiedyś, że „przewidywanie jest bardzo trudne, szczególnie jeśli idzie o przyszłość”. To prawda, przewidywanie przyszłości to nieco karkołomne zajęcie, jednak, o ile posiada się wystarczająco dużo danych z przeszłości, można ją do pewnego stopnia zaprognozować. Na tym dokładnie polega prognozowanie szere
(67,05 zł najniższa cena z 30 dni)
74.50 zł
149.00 zł (-50%) -
Wiesz, czym jest REST API? Skoro rozpoczynasz przygodę z programowaniem albo jej początki masz już za sobą, pewnie wiesz - a przynajmniej znasz te terminy ze słyszenia. Mimo to przypominamy: API, czyli aplikacyjny interfejs programistyczny, to zestaw reguł określających sposób, w jaki urządzenia i aplikacje mają się ze sobą łączyć i komunikować, z
(52,15 zł najniższa cena z 30 dni)
67.05 zł
149.00 zł (-55%) -
Zawód programisty jest coraz popularniejszym życiowym wyborem - wciąż bowiem rośnie zapotrzebowanie na pracowników IT, a branża oferuje absolwentom informatyki satysfakcjonujące pensje, atrakcyjne warunki pracy, często też możliwość działania zdalnego. Jeśli myślisz o obraniu tej właśnie ścieżki zawodowej (albo o zmianie aktualnej profesji na IT),
(34,75 zł najniższa cena z 30 dni)
62.55 zł
139.00 zł (-55%) -
Pygame to jedna z tych fantastycznych bibliotek, które pozwalają poszerzyć możliwości programowania gier i aplikacji multimedialnych w języku Python. Ostatnio zyskuje coraz większą popularność — w zeszłym roku pojawiła się jej nowa wersja, Pygame 2. Jeśli znasz już język Python i marzysz o tym, by wykorzystać go do kreowania świetnych gier, nie zna
(62,25 zł najniższa cena z 30 dni)
112.05 zł
249.00 zł (-55%) -
Nic skuteczniej niż rutyna nie zabija kreatywności. Konieczność monotonnego powtarzania tych samych mechanicznych czynności i zadań może źle wpłynąć na jakość naszej codziennej pracy - niezależnie od tego, czym się zajmujemy. Ale uwaga: nie musi tak być. W każdym razie nie wtedy, kiedy swoją pracę wykonujemy przy komputerze, znamy w stopniu przynaj
(37,25 zł najniższa cena z 30 dni)
67.05 zł
149.00 zł (-55%) -
Jednym z języków umożliwiających przetwarzanie i analizę danych jest otwarty język programowania R. Dzięki temu, że współtworzą go tysiące użytkowników z całego świata, R zapewnia dostęp do ogromnej liczby gotowych narzędzi analitycznych, pozwalających przekształcić suche, anonimowe dane w konkretną wiedzę przydatną dla ludzi biznesu, naukowców i p
(13,65 zł najniższa cena z 30 dni)
17.55 zł
39.00 zł (-55%)
O autorze kursu video
Piotr Chudzik - absolwent Politechniki Łódzkiej, jego specjalizacja zawodowa to technologie big data oraz administracja nowoczesnymi środowiskami IT (wykorzystującymi między innymi cloud computing, konteneryzację czy IaC - infrastructure as code). Pracuje jako wykładowca na Uniwersytecie Łódzkim, gdzie przekazuje studentom wiedzę na temat Linuksa, baz danych i programowania w języku Python. Jest również trenerem w Software Development Academy. Na co dzień zatrudniony jako menadżer techniczny w dużym zagranicznym banku, odpowiada za prawidłowe i nieprzerwane działanie aplikacji opartych na Google Cloud Platform. Zawsze otwarty na nowe doświadczenia oraz wiedzę, którą w przyszłości mógłby się podzielić z innymi. Interesuje się grami komputerowymi, światem nowych technologii i fantastyką. Jest fanem serii Wiedźmin i uniwersum Warhammera.
Sukces wymaga wcześniejszego przygotowania, bez niego z pewnością osiągniemy porażkę.
Konfucjusz
Piotr Chudzik - pozostałe kursy
-
Jeśli jesteś programistą, na przykład pracujesz jako specjalista w dziedzinie DevOps i do Twoich zadań należy między innymi utrzymanie środowiska produkcyjnego – także z użyciem rozwiązań chmurowych – nazwa Kubernetes z pewnością nie jest Ci obca. Przypomnijmy jednak dla porządku: zyskujący popularność na całym świecie Kubernetes (zwany także K8s)
(70,95 zł najniższa cena z 30 dni)
64.50 zł
129.00 zł (-50%) -
Jeśli pracujesz lub będziesz pracować na danych, prędzej czy później zetkniesz się z akronimem ETL. ETL, czyli wyodrębnianie, przekształcanie i ładowanie, jest procesem powszechnie stosowanym przez organizacje gromadzące i łączące dane z wielu źródeł w celu wspomagania zadań wykrywania, raportowania, analizowania i podejmowania decyzji. Apache Airf
(50,70 zł najniższa cena z 30 dni)
76.05 zł
169.00 zł (-55%) -
Kurs video, który dziś proponujemy, skupia się na kwestii podatności Pythona na automatyzację. Pokażemy, jak zaoszczędzić czas dzięki efektywnemu programowaniu z wykorzystaniem najlepszych technik. Dobrze, by słuchacz przed przystąpieniem do szkolenia posiadał już pewną znajomość Pythona w zakresie podstawowych typów danych, zmiennych, pętli, instr
(67,05 zł najniższa cena z 30 dni)
59.59 zł
149.00 zł (-60%) -
Konteneryzacja jest alternatywą dla wirtualizacji. W pracy z nowo wdrażanymi, testowanymi czy usprawnianymi aplikacjami pozwala ograniczyć wykorzystanie zasobów i uruchamiać niezależnie wiele aplikacji na jednej maszynie. Kontenery są od siebie całkowicie odizolowane, nic o sobie nawzajem nie „wiedzą”, każdy zawiera własne środowisko. I właśnie ze
(67,05 zł najniższa cena z 30 dni)
67.05 zł
149.00 zł (-55%) -
Platforma Docker znacznie ułatwiła życie programistom. Dzięki niej zarówno program, jak i jego zależności, takie jak biblioteki, pliki konfiguracyjne czy lokalne bazy danych, można umieścić w lekkim, przenośnym wirtualnym kontenerze, uruchamialnym na praktycznie każdym serwerze z systemem pracującym na jądrze Linux. Nic więc dziwnego, że Docker sta
(51,60 zł najniższa cena z 30 dni)
64.50 zł
129.00 zł (-50%) -
Na szczęście Docker należy do tych technologii, w które łatwo się wdrożyć. Zresztą istnieje sporo szkoleń, kursów i książek dla początkujących użytkowników tego oprogramowania. Gorzej z opracowaniami na temat zaawansowanej obsługi Dockera. Tymczasem oferuje on wiele narzędzi i sztuczek, których znajomość pozwala przyspieszyć i ułatwić realizację za
(32,25 zł najniższa cena z 30 dni)
51.60 zł
129.00 zł (-60%) -
Powiedzieć, że Python jest jednym z najpopularniejszych języków programowania, to nic nie powiedzieć. Doceniają go i od lat wybierają developerzy na całym świecie. Oni go także rozwijają. Ten język programowania wysokiego poziomu jest bowiem dostępny jako projekt typu open source, z błogosławieństwem Python Software Foundation, by udoskonalać Pytho
(69,65 zł najniższa cena z 30 dni)
79.59 zł
199.00 zł (-60%) -
Kto się decyduje na karierę programisty, musi wybrać swój „ulubiony” język. Ten, w którym będzie się specjalizować, doskonalić, pracować. Oczywiście nie musi to być jeden jedyny język. Chodzi po prostu o język pierwszego wyboru, w którego zakresie będzie się ekspertem. Wielu programistów wybiera do tej roli Javę, czyniąc ją tym samym jednym z najpo
(67,60 zł najniższa cena z 30 dni)
67.60 zł
169.00 zł (-60%) -
Umiejętność zarządzania bazami danych z roku na rok jest coraz bardziej ceniona. Nic w tym dziwnego - ilość danych, jakimi dysponujemy, a które musimy gdzieś przechowywać, sortować, zestawiać ze sobą i z których chcemy wyciągać ważne dla siebie informacje, stale rośnie. Stąd firmy szczególnie wypatrują specjalistów, którzy potrafią to robić - poszu
(38,15 zł najniższa cena z 30 dni)
49.05 zł
109.00 zł (-55%) -
SQL to obok xBase najpopularniejszy język zapytań - stosowany przede wszystkim po to, by formułować zapytania do baz danych i otrzymywać w odpowiedzi raporty zawierające oczekiwane dane. Równocześnie SQL jest najpowszechniejszym w informatyce sposobem przechowywania informacji, na którym bazują takie nowoczesne systemy ich przechowywania i przetwar
(55,65 zł najniższa cena z 30 dni)
71.55 zł
159.00 zł (-55%)
Spis lekcji (odkodowane lekcje)
Kurs Video "PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły kursu
- Ilość lekcji:
- 38
- Czas trwania:
- 3 godz. 50 min.
- Format:
- Online
- Rok nagrania:
- 2023-10-10
- ISBN :
- 978-83-289-0401-9, 9788328904019
- Data wydania :
- 2023-10-10
- Numer z katalogu:
- 214833
- Do kursu dołączone są materiały dodatkowe, znajdziesz je w Twojej Bibliotece
- Kategorie:
Programowanie » Python
Big Data » Wizualizacja danych
Data Science » Analiza danych
Videopoint - inne kursy
-
Jaki jest najgorętszy temat w informatyce ostatnich lat? Bez wątpienia palmę pierwszeństwa dzierży sztuczna inteligencja. Jej możliwości, rozwój, sposoby, za których pośrednictwem działa. A skoro o AI mowa, to nie sposób nie poruszyć zagadnienia uczenia maszynowego: obszaru sztucznej inteligencji poświęconego algorytmom, które poprawiają się automa
(71,60 zł najniższa cena z 30 dni)
80.55 zł
179.00 zł (-55%) -
Początków C++ należy szukać w latach 70. XX wieku, kiedy powstał imperatywny, proceduralny język ogólnego przeznaczenia C. C++ stanowi jego rozszerzenie o obiektowe mechanizmy abstrakcji danych i silną statyczną kontrolę typów. Zgodny z językiem C na poziomie kodu źródłowego, pozwala na abstrakcję danych i stosowanie paradygmatów programowania proc
(51,60 zł najniższa cena z 30 dni)
64.50 zł
129.00 zł (-50%) -
Java należy do najpopularniejszych języków programowania na świecie. Używana przez miliony programistów, jest na tyle uniwersalna, że znajduje zastosowanie zarówno w aplikacjach desktopowych, mobilnych, jak i serwerowych, a także w zaawansowanych systemach zarządzania bazami danych. Z jej zalet korzystają samodzielni specjaliści, niewielkie firmy i
(39,60 zł najniższa cena z 30 dni)
44.55 zł
99.00 zł (-55%) -
Identyfikacja wizualna to kluczowy element strategii marketingowej, który pozwala przedsiębiorstwom budować spójny wizerunek i uzyskiwać rozpoznawalność na rynku. Właśnie dlatego kursy takie jak ten są coraz bardziej popularne i cenione przez właścicieli małych firm. Nasze szkolenie sprawi, że zdobędziesz umiejętności niezbędne do tego, by samodzie
(51,60 zł najniższa cena z 30 dni)
58.04 zł
129.00 zł (-55%) -
Kariera zawodowa programisty jest związana z nieustanną nauką i doskonaleniem zdobytych umiejętności. Jednym z podstawowych etapów rozwoju programisty Java jest zaznajomienie się z dobrymi praktykami programistycznymi, co obejmuje także wzorce projektowe – i to im właśnie poświęcony jest ten kurs. Wzorce projektowe stanowią zestaw praktycznych rozw
(59,60 zł najniższa cena z 30 dni)
67.05 zł
149.00 zł (-55%) -
Spotkania biznesowe – z dostawcami, klientami i w szerszym gronie współpracowników – potrafią spędzać sen z powiek, nawet jeśli odbywają się w języku polskim. Poza urodzonymi oratorami, uwielbiającymi błyszczeć wobec zgromadzonej publiki, większość ludzi po prostu się denerwuje, kiedy muszą przemawiać publicznie czy też gdy rozmawiają jeden na jede
(23,70 zł najniższa cena z 30 dni)
35.55 zł
79.00 zł (-55%) -
W 2022 roku około 10% architektury IT było zarządzane za pomocą chmur obliczeniowych. Prognozuje się, że ten trend będzie rósł i do 2027 roku rzeczony odsetek wzrośnie do 35%. Bez wątpienia wiąże się to z faktem, że świat IT ewoluuje niezwykle szybko, a współczesne aplikacje stają się coraz bardziej złożone – bez zaangażowania chmury nie byłoby moż
(53,70 zł najniższa cena z 30 dni)
89.49 zł
179.00 zł (-50%) -
Jeśli jesteś inżynierem lub technikiem i w sytuacjach zawodowych porozumiewasz się w języku angielskim, z pewnością zdajesz sobie sprawę z tego, jaką przewagę na rynku pracy daje Ci ta umiejętność. Otwiera przed Tobą drzwi międzynarodowych korporacji i firm, które operują na zagranicznych rynkach. Pozwala Ci uczestniczyć w szkoleniach, konferencjac
(44,70 zł najniższa cena z 30 dni)
67.05 zł
149.00 zł (-55%) -
Jednym z obszarów, w które AI wkracza coraz śmielej, jest programowanie. Tam, gdzie pracuje się z liczbami, kodem i algorytmami, pomoc sztucznej inteligencji okazuje się nieoceniona. Jak ją zaprosić do współpracy? Tego dowiesz się z naszego kursu. Jego tematyka obejmuje bowiem programowanie z wykorzystaniem takich narzędzi jak ChatGPT czy GitHub Co
(50,70 zł najniższa cena z 30 dni)
67.60 zł
169.00 zł (-60%) -
Nasz kurs bowiem pozwala zdobyć kompleksową wiedzę i umiejętności, jakich potrzebujesz do tego, by zbudować swoją pierwszą aplikację internetową przy użyciu platformy ASP.NET Core 6. Stworzysz aplikację od początku do końca w sposób maksymalnie praktyczny, wspomagając się w tym celu zintegrowanym środowiskiem programistycznym Visual Studio 2022. Po
(39,90 zł najniższa cena z 30 dni)
89.49 zł
179.00 zł (-50%)
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas:
Kurs video


Oceny i opinie klientów: PySpark. Kurs video. Przetwarzanie i analiza danych w procesach ETL Piotr Chudzik (0)
Weryfikacja opinii następuje na podstawie historii zamowień na koncie Użytkownika umiejszczającego opinię.
Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniającej do uzyskania rabatu w ramach Programu Kadr.