Databricks. Kurs video. Wstęp do architektury Data Lakehouse
- Ocena:
- Bądź pierwszym, który oceni ten kurs
- Wersja:
- Online
- Czas trwania:
- 05:46:51
- Technologia:
- Databricks 15.4
Opis kursu video Databricks. Kurs video. Wstęp do architektury Data Lakehouse
Obierz kurs na... inżynierię danych
Jeśli myślisz o karierze inżyniera danych, ale nie masz doświadczenia w pracy na tym stanowisku, to ten kurs jest dla Ciebie idealną propozycją. Inżynier danych dostarcza je innym zespołom w firmie – usługę tę świadczy głównie dla analityków danych i dla data scientist. Do głównych obowiązków inżyniera danych należy tworzenie procesów ETL i ELT, walidacja danych i przygotowywanie ich poprzez budowanie systemu pobierania (na przykład strumienie danych lub orkiestracja zadań). Jego pracę ułatwiają i usprawniają odpowiednie narzędzia. Takie jak platforma analityczna Databricks.
Databricks stanowi jedno z najpopularniejszych rozwiązań służących przetwarzaniu, procesowaniu i analizie danych. Funkcjonuje ono, opierając się na własnym formacie danych, zwanym Delta. Specyfiką tej platformy jest to, że pozwala na tworzenie struktury danych podobnej do relacyjnych baz danych. Jeśli chcesz ją poznać i nauczysz się procesować w niej dane, zapraszamy na szkolenie. W jego trakcie omówimy podstawowe tematy związane z platformą Databricks – przede wszystkim kwestie dotyczące reguł pracy z notebookami i formatem Delta. Przyjrzysz się także kwestiom związanym z korzystaniem z innych modułów Databricks, takich jak SQL Warehouse, Workflows, czy zasadom tworzenia polityki klastra.
Co Cię czeka podczas naszego profesjonalnego szkolenia
Podczas kursu między innymi:
- Przygotujesz środowisko pracy
- Zaczniesz pracować z notebookami
- Przyjrzysz się sposobom korzystania z widgetów i „magic functions” w swoich zadaniach
- Będziesz tworzyć własne klastry obliczeniowe i ich polityki, a także uruchamiać na nich niezbędne biblioteki i skrypty
- Dowiesz się, czym jest dDBFS i jak odczytuje się z niego dane
- Poznasz format Delta
- Wykonasz polecenia SQL w ramach hurtowni danych i stworzysz na niej funkcje
- Zautomatyzujesz zadania za pomocą Workflows
- Zaprezentujesz dane za pomocą Dashboard
Databricks. Kurs video. Wstęp do architektury Data Lakehouse kończy się na poziomie podstawowym. Wiedza zdobyta w trakcie szkolenia pozwala na postawienie pierwszych kroków na platformie Databricks. Nabyte informacje oczywiście można zastosować w praktyce – na przykład w celu przeniesienia swojej pracy w języku Python, Scala, SQL i Spark do środowiska Databricks.
Wybrane bestsellery
-
Bestseller Promocja
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku związanym ze statystyką i z analizą danych. Razem bowiem stano(39,90 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł (-40%) -
Nowość Promocja
Analiza biznesowa to proces definiowania potrzeb organizacji i opracowywania strategii, które pomagają na nie odpowiadać. Jest niezbędna, by firmy mogły lepiej rozumieć swoje cele, oczekiwania klientów i wymagania rynku. Choć nie stanowi nowego obszaru, popularność zdobywa od niedawna, głównie z powodu powtarzających się problemów w realizacji proj(103,34 zł najniższa cena z 30 dni)
55.65 zł
159.00 zł (-65%) -
Nowość Promocja
Stanowiący część Microsoft Power Platform zestaw narzędzi Power BI służy przede wszystkim wizualizacji danych i raportowaniu. Ze względu na intuicyjny interfejs i duże możliwości narzędzia te są coraz częściej zaprzęgane do pracy w firmach na całym świecie, w rozmaitych branżach – od finansów, przez marketing, aż po zarządzanie zasobami ludzkimi. S(89,54 zł najniższa cena z 30 dni)
69.65 zł
199.00 zł (-65%) -
Bestseller Promocja
Apache Spark to narzędzie do przetwarzania danych w trybie rozproszonym, które umożliwia budowanie zaawansowanych systemów operacji na złożonych zbiorach danych. Przetwarzanie rozproszone poprzez wykorzystanie wielu maszyn jednocześnie znacząco przyspiesza operacje na dużych ilościach danych. Spark jest niezwykle popularny, stosowany w licznych pro(59,59 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Bestseller Promocja
Jeśli myślisz o karierze analityka danych albo starasz się o pracę na stanowisku, na którym będziesz analizować dane, ten kurs jest specjalnie dla Ciebie. Opanujesz dzięki niemu między innymi niezbędne podstawy języka SQL i dowiesz się, jak funkcjonuje i do czego może Ci posłużyć system zarządzania relacyjnymi bazami danych MySQL. Te dwie technolog(99,59 zł najniższa cena z 30 dni)
99.59 zł
249.00 zł (-60%) -
Promocja
Szybka i efektywna analiza danych – temu właśnie służą tabele i wykresy przestawne dostępne w arkuszu kalkulacyjnym Excel. Nieistotne dla osób, które z Excela korzystają doraźnie – po to, by ułatwić sobie zapisywanie pewnych informacji i prezentowanie ich w bardziej profesjonalny sposób – w rękach eksperta od analizy stają się naprawdę potężnym nar(69,65 zł najniższa cena z 30 dni)
129.35 zł
199.00 zł (-35%) -
Promocja
Dzisiejszą gospodarką rządzi informacja. Kto potrafi ją wyłuskać z zalewu danych, ten zyskuje konkurencyjną przewagę. Świadomi tego twórcy oprogramowania komputerowego stworzyli szereg narzędzi służących wyszukiwaniu informacji, ich przetwarzaniu, analizowaniu i prezentowaniu w sposób dostępny dla odbiorców. Jednym z nich jest Elasticsearch – techn(87,15 zł najniższa cena z 30 dni)
149.40 zł
249.00 zł (-40%) -
Promocja
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi program R, którego zaletą jest łatwe tworzenie dashb(52,15 zł najniższa cena z 30 dni)
89.40 zł
149.00 zł (-40%) -
Promocja
Oprogramowanie Apache Kafka powstało jako broker wiadomości w LinkedIn. Obecnie pełni funkcję rozproszonego systemu przetwarzania strumieniowego danych, używanego do budowania aplikacji opracowujących duże ilości danych w czasie rzeczywistym. Z zalet tego oprogramowania korzystają firmy na całym świecie – jest kluczowym narzędziem w takich sektorac(31,14 zł najniższa cena z 30 dni)
53.39 zł
89.00 zł (-40%) -
Promocja
Czy zastanawiasz się czasem nad tym, jak to możliwe, że jesteśmy w stanie „rozmawiać” z maszynami? Że coś mówimy, a one nas rozumieją i odpowiadają na nasze pytania, realizują polecenia, wykonują zadania? I na odwrót – to one mówią (i piszą) do nas słowami, które są dla nas jasne? Przetwarzaniem języka naturalnego (ang. natural language processing,(52,15 zł najniższa cena z 30 dni)
89.40 zł
149.00 zł (-40%)
O autorze kursu video
Piotr Chudzik - absolwent Politechniki Łódzkiej, jego specjalizacja zawodowa to technologie big data oraz administracja nowoczesnymi środowiskami IT (wykorzystującymi między innymi cloud computing, konteneryzację czy IaC - infrastructure as code). Pracuje jako wykładowca na Uniwersytecie Łódzkim, gdzie przekazuje studentom wiedzę na temat Linuksa, baz danych i programowania w języku Python. Jest również trenerem w Software Development Academy. Na co dzień zatrudniony jako menadżer techniczny w dużym zagranicznym banku, odpowiada za prawidłowe i nieprzerwane działanie aplikacji opartych na Google Cloud Platform. Zawsze otwarty na nowe doświadczenia oraz wiedzę, którą w przyszłości mógłby się podzielić z innymi. Interesuje się grami komputerowymi, światem nowych technologii i fantastyką. Jest fanem serii Wiedźmin i uniwersum Warhammera.
Sukces wymaga wcześniejszego przygotowania, bez niego z pewnością osiągniemy porażkę.
Konfucjusz
Piotr Chudzik - pozostałe kursy
-
Promocja
Jeśli pracujesz lub będziesz pracować na danych, prędzej czy później zetkniesz się z akronimem ETL. ETL, czyli wyodrębnianie, przekształcanie i ładowanie, jest procesem powszechnie stosowanym przez organizacje gromadzące i łączące dane z wielu źródeł w celu wspomagania zadań wykrywania, raportowania, analizowania i podejmowania decyzji. Apache Airf(59,15 zł najniższa cena z 30 dni)
101.40 zł
169.00 zł (-40%) -
Promocja
Czy znane są Ci nazwy Apache Spark i PySpark? Jeśli pracujesz z danymi i do tej pory nie poznałeś tej technologii, najwyższy czas to nadrobić – na przykład w trakcie proponowanego przez nas szkolenia wideo. Apache Spark to otwarta platforma programistyczna służąca do obliczeń rozproszonych. Opracowana i rozwijana początkowo na Uniwersytecie Kalifor(52,15 zł najniższa cena z 30 dni)
89.40 zł
149.00 zł (-40%) -
Bestseller Promocja
Platforma Docker znacznie ułatwiła życie programistom. Dzięki niej zarówno program, jak i jego zależności, takie jak biblioteki, pliki konfiguracyjne czy lokalne bazy danych, można umieścić w lekkim, przenośnym wirtualnym kontenerze, uruchamialnym na praktycznie każdym serwerze z systemem pracującym na jądrze Linux. Nic więc dziwnego, że Docker sta(38,70 zł najniższa cena z 30 dni)
70.95 zł
129.00 zł (-45%) -
Bestseller Promocja
Na szczęście Docker należy do tych technologii, w które łatwo się wdrożyć. Zresztą istnieje sporo szkoleń, kursów i książek dla początkujących użytkowników tego oprogramowania. Gorzej z opracowaniami na temat zaawansowanej obsługi Dockera. Tymczasem oferuje on wiele narzędzi i sztuczek, których znajomość pozwala przyspieszyć i ułatwić realizację za(38,70 zł najniższa cena z 30 dni)
70.95 zł
129.00 zł (-45%) -
Nowość Promocja
Mianem Linuksa określamy całą rodzinę systemów operacyjnych, które bazują na jądrze Linux. Jest to oprogramowanie wolne i otwarte, jego kod może być dowolnie wykorzystywany i rozpowszechniany oraz przebudowywany w zależności od potrzeb. Odkąd w 2017 roku oparto na nim najpopularniejszy system mobilny Android, Linux jest najbardziej rozpowszechniony(58,04 zł najniższa cena z 30 dni)
45.15 zł
129.00 zł (-65%) -
Promocja
Statycznie typowany język programowania Scala charakteryzuje się między innymi tym, że wspiera zarówno programowanie funkcyjne, jak i obiektowe. Co więcej, Scala jest językiem wieloplatformowym – działa na maszynie wirtualnej Javy i platformie .NET. W najnowszej wersji (3) składnia Scali mocno zbliża się do składni Pythona i równocześnie dzieli bib(45,15 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł (-40%) -
Promocja
Jeśli jesteś programistą, na przykład pracujesz jako specjalista w dziedzinie DevOps i do Twoich zadań należy między innymi utrzymanie środowiska produkcyjnego – także z użyciem rozwiązań chmurowych – nazwa Kubernetes z pewnością nie jest Ci obca. Przypomnijmy jednak dla porządku: zyskujący popularność na całym świecie Kubernetes (zwany także K8s)(45,15 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł (-40%) -
Bestseller Promocja
Kurs video, który dziś proponujemy, skupia się na kwestii podatności Pythona na automatyzację. Pokażemy, jak zaoszczędzić czas dzięki efektywnemu programowaniu z wykorzystaniem najlepszych technik. Dobrze, by słuchacz przed przystąpieniem do szkolenia posiadał już pewną znajomość Pythona w zakresie podstawowych typów danych, zmiennych, pętli, instr(44,70 zł najniższa cena z 30 dni)
81.95 zł
149.00 zł (-45%) -
Promocja
Konteneryzacja jest alternatywą dla wirtualizacji. W pracy z nowo wdrażanymi, testowanymi czy usprawnianymi aplikacjami pozwala ograniczyć wykorzystanie zasobów i uruchamiać niezależnie wiele aplikacji na jednej maszynie. Kontenery są od siebie całkowicie odizolowane, nic o sobie nawzajem nie „wiedzą”, każdy zawiera własne środowisko. I właśnie ze(44,70 zł najniższa cena z 30 dni)
81.95 zł
149.00 zł (-45%) -
Bestseller Promocja
Powiedzieć, że Python jest jednym z najpopularniejszych języków programowania, to nic nie powiedzieć. Doceniają go i od lat wybierają developerzy na całym świecie. Oni go także rozwijają. Ten język programowania wysokiego poziomu jest bowiem dostępny jako projekt typu open source, z błogosławieństwem Python Software Foundation, by udoskonalać Pytho(59,70 zł najniższa cena z 30 dni)
109.45 zł
199.00 zł (-45%)
Spis lekcji (odkodowane lekcje)
-
1. Wprowadzenie 00:37:44
-
2. Workspace i Data Explorer 00:40:30
-
3. Praca z notebookiem 00:54:50
- 3.1. Odczyt danych z DBFS 00:05:00
- 3.2. dbutils - nazwa użytkownika i notebooka 00:04:15
- 3.3. Widgety - tworzenie/usuwanie (Python) 00:12:45
- 3.4. Widgety - tworzenie/usuwanie (SQL + UI) 00:07:53
- 3.5. Widgety - pobieranie wartości 00:07:11
- 3.6. Funkcja %run 00:08:05
- 3.7. getAll/zasięg zmiennych 00:03:47
- 3.8. Podsumowanie rozdziału 00:05:54
-
4. Praca z formatem delta 01:37:48
- 4.1. Funkcja display() i _sqldf 00:08:50
- 4.2. Tworzenie/Usuwanie bazy danych 00:04:43
- 4.3. Zapis danych do formatu Delta 00:06:08
- 4.4. Tworzenie/Usuwanie tabeli 00:10:18
- 4.5. Polecenie MERGE INTO (SQL) 00:15:28
- 4.6. Polecenie MERGE INTO (Python) 00:14:00
- 4.7. Wersje danych/Odczyt katalogu z SQL 00:11:13
- 4.8. Polecenia ANALYZE TABLE/VACUUM 00:09:18
- 4.9. Polecenie ZORDER 00:09:20
- 4.10. Podsumowanie rozdziału 00:08:30
-
5. Konfiguracja środowiska 00:41:39
-
6. SQL Warehouse/Data Profiler 00:41:01
-
7. Automatyzacja zadań 00:42:09
Kurs Video "Databricks. Kurs video. Wstęp do architektury Data Lakehouse" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły kursu
- Ilość lekcji:
- 42
- Czas trwania:
- 5 godz. 46 min.
- Format:
- Online
- Data aktualizacji:
- 2024-11-12
- ISBN :
- 978-83-289-1839-9, 9788328918399
- Numer z katalogu:
- 242634
- Kategorie:
Big Data
Data Science » Analiza danych
Videopoint - inne kursy
-
Bestseller Nowość Promocja
Znajomość sztucznej inteligencji w kontekście generowania wideo to ważny aspekt nowoczesnej produkcji wizualnej. AI rozwija się w zawrotnym tempie, rewolucjonizując branżę filmową i kreatywną. Narzędzia takie jak Runway, PikaLabs, Kaiber czy Luma, a także open-source'owe aplikacje, jak Comfy UI, Stable Video Diffusion i CogVideo, umożliwiają twórco(58,04 zł najniższa cena z 30 dni)
45.15 zł
129.00 zł (-65%) -
Bestseller Nowość Promocja
Asystenci programowania AI, tacy jak GitHub Copilot i Continue, są coraz bardziej powszechni w branży IT. Na co dzień wspomagają programistów w generowaniu kodu, refaktoryzacji, debugowaniu i optymalizacji aplikacji. Wprowadzenie tych technologii do codziennej pracy może znacząco zwiększyć produktywność, zmniejszyć liczbę błędów i przyspieszyć czas(53,55 zł najniższa cena z 30 dni)
41.65 zł
119.00 zł (-65%) -
Bestseller Nowość Promocja
Angular to jeden z najpopularniejszych frameworków służących do tworzenia rozbudowanych aplikacji korporacyjnych i biznesowych. Jego struktura, oparta na jasnych klasach i modułach, jest intuicyjna dla developerów backendowych, co czyni go znakomitym wyborem dla osób planujących przejść na full-stack. Testowanie kodu w Angularze w narzędziach Cypre(67,05 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Bestseller Nowość Promocja
Amazon Web Services (AWS) to obecnie najpopularniejsza chmura publiczna. Jednym z ważniejszych serwisów AWS jest AWS Lambda – platforma serverless, która umożliwia uruchamianie kodu bez konieczności zarządzania infrastrukturą. Lambda może automatycznie skalować aplikacje, obsługując setki tysięcy żądań w ciągu sekundy, bez dodatkowej konfiguracji.(39,90 zł najniższa cena z 30 dni)
55.65 zł
159.00 zł (-65%) -
Bestseller Nowość Promocja
Przetwarzanie obrazów to dynamicznie rozwijająca się dziedzina, która znajduje zastosowanie w licznych branżach, takich jak medycyna, motoryzacja, przemysł rozrywkowy, bezpieczeństwo, rolnictwo czy marketing. Umożliwia automatyczne rozpoznawanie obiektów, analizę obrazów medycznych i tworzenie interaktywnych aplikacji korzystających ze sztucznej in(34,65 zł najniższa cena z 30 dni)
34.65 zł
99.00 zł (-65%) -
Bestseller Nowość Promocja
Wśród zyskujących popularność nurtów, które obserwujemy w świecie IT, wyróżnia się wirtualizacja. Drugim odmienianym przez wszystkie przypadki trendem jest konteneryzacja. Stąd rosnąca popularność platformy Proxmox, której można używać do dwóch celów – właśnie do konteneryzacji i do wirtualizacji. Realizacja tych dwóch procesów w ramach jednego opr(43,60 zł najniższa cena z 30 dni)
38.15 zł
109.00 zł (-65%) -
Bestseller Promocja
Obierz kurs na... sprawniejsze projektowanie interfejsów Jeśli - komercyjnie lub na razie tylko amatorsko - tworzysz strony internetowe i aplikacje mobilne, z pewnością nazwa Figma nie jest Ci obca. W końcu to chmurowe narzędzie jest uznawane, obok na przykład AdobeXD, za jedno z najnowocześniejszych przeznaczonych do tego oprogramowań. Korzystają(39,90 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Bestseller Promocja
Windows Server 2022 to sieciowy system operacyjny stworzony przez Microsoft. Został zaprojektowany z myślą o obsłudze dużych sieci komputerowych i infrastruktur IT. Jego popularność ciągle rośnie, szczególnie w zastosowaniach sieciowych jako serwery lokalne i serwery usług, takich jak WWW, FTP, chmura, DHCP, DNS, VPN, Print Server czy Hyper-V. Jest(59,59 zł najniższa cena z 30 dni)
52.15 zł
149.00 zł (-65%) -
Bestseller Promocja
W dynamicznie zmieniającym się świecie biznesu automatyzacja procesów staje się kluczowym elementem sukcesu każdej organizacji. Technologia RPA (ang. robotic process automation) w połączeniu z zarządzaniem projektami i inżynierią oprogramowania tworzy nowy standard w zarządzaniu zasobami i operacjami firmowymi. I tu wkracza Microsoft Power Automate(39,90 zł najniższa cena z 30 dni)
38.15 zł
109.00 zł (-65%) -
Bestseller Promocja
Marzysz o pracy w IT, która „robi różnicę”? Stanowisko inżyniera sieci wiąże się ze sporą odpowiedzialnością, ponieważ od niego zależy działanie sieci całego przedsiębiorstwa. Tylko co to właściwie znaczy? W praktyce chodzi o prawidłowe funkcjonowanie programów i aplikacji sieciowych, działanie telefonii IP, możliwość tworzenia kopii zapasowych i k(67,60 zł najniższa cena z 30 dni)
109.85 zł
169.00 zł (-35%)
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas:
Kurs video
Oceny i opinie klientów: Databricks. Kurs video. Wstęp do architektury Data Lakehouse Piotr Chudzik (0) Weryfikacja opinii następuje na podstawie historii zamowień na koncie Użytkownika umiejszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniającej do uzyskania rabatu w ramach Programu Kadr.