PySpark¶

21 de novembro de 2024
em PySpark, Data Science, Tech
4 min de leitura

O que é `pyspark.sql.context`? 🎩✨

Quando comecei a trabalhar com Databricks, confesso que me senti como um terráqueo vendo um disco voador pela primeira vez. Era outro mundo, meu povo! 🌌

19 de novembro de 2024
em PySpark, Data Science, Tech
5 min de leitura

Ah, relacionamentos no SQL?

alt text

Pense nisso como dramas de relacionamento, mas entre tabelas de dados! 😂 Vamos lá:

Relacionamento de “Um pra Um” (1:1) Esse é aquele namoro exclusivo, onde cada item em uma tabela só pode estar com um único item em outra tabela. Nada de triangulo amoroso aqui!

Exemplo: Uma tabela de pessoas e uma tabela de carteira de identidade. Cada pessoa tem uma carteira, e cada carteira pertence a uma única pessoa. Bem monogâmico.

15 de novembro de 2024
em PySpark, Tech, Data Science
4 min de leitura

Afinal, o que são funções? 🤔 Se a gente fizer um paralelo com a etimologia da palavra "função", dá pra pensar em algo que expressa ou controla um comportamento – só que, no mundo da programação, isso rola por meio de código. Legal, né? Ou talvez até meio nerd, rs.

Eu gosto de pensar que funções são as ferramentas mágicas do desenvolvedor. Tipo aquela “caixa de ferramentas” onde você encontra tudo que precisa pra fazer magia com os dados. Quer somar colunas? Beleza. Transformar texto pra minúsculas? Fácil. Ordenar, calcular média, e até umas coisas mais avançadas? Tá tudo lá, prontinho pra usar. 🚀

2 de julho de 2024
em PySpark, Tech, Data Science
3 min de leitura

PySpark¶

O que é `pyspark.sql.context`? 🎩✨

Ah, relacionamentos no SQL?

FuncoesPySpark

PySpark

Afinal o que são funções?

Como os Aplicativos PySpark podem ser redimensionados.

Como Dimensionar Aplicativos PySpark de Forma Eficiente?

Como fazer isso de modo mais eficiente?