Special: Zusammen das Datacenter weiterentwickeln Secure IT für Unternehmen

Online-Workshop: Big-Data-Analysen mit Python und Spark

Alle Heise-Foren heise online Kommentare Online-Workshop: Big-Data-Ana… Re: Pyhton, Spark, BigData si…

- 
- Beitrag
- 
- 
- Threads
- 

Ansicht umschalten

dispanser

136 Beiträge seit 13.08.2002

14.08.2020 11:01

Re: Pyhton, Spark, BigData sind Buzzwörter die in die Bullshit-Bingo Suppe gehör

Mein Verständnis von der Idee hinter Hadoop und Spark ist:

- Logik wird (soweit möglich) auf dem Knoten ausgeführt, wo die Daten liegen
- damit erhält man parallelelen I/O auf vielen, vielen Storage-Devices
- die Skalierung beginnt also schon beim Lesen der Daten

Klar, die neuen Buzzwords beschreiben oft Dinge, die es schon vor vielen Jahren gab, aber die Datenmengen sind deutlich gewachsen -- wer die Daten auf einen einzelnen SQL-Server packen kann hat vermutlich kein "Big Data".

Ansonsten ist Spark-SQL gar nicht so weit entfernt von richtigem SQL: soweit ich weiss wird der SQL2003 Standard unterstützt...

Bewerten

- +

Thread-Anzeige einblenden

- 
- Beitrag
- 
- 
- Threads
- 

Ansicht umschalten

Nutzungsbedingungen

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}

${intro} ${title}

Re: Pyhton, Spark, BigData sind Buzzwörter die in die Bullshit-Bingo Suppe gehör