Olá pessoinha! Vc que é da sofrência e gosta de usar ferramentas open source assim como eu, está passando por problemas de caracteres zoados no seu DW, Cubo, BI, etc?

Bom neste post vou mostrar como resolver uma treta do Pentaho Data Integration! Conhecido também como PDI, Kettle, Spon e Mother on the zone. Hahaha!

Pois bem, é muito comum no dia-a-dia de quem faz pipeline de dados ou cria modelos e fluxos de ETL com o PDI se deparar com a seguinte situação:

Temos uma tabela origem no legado, onde existem palavras com caracteres especiais como [áçõêì], resultando no famoso � ao carregar os dados na stage ou no DW. O que geralmente me deixa P… da vida.

Se você perguntar em um fórum ou grupo de Whatsapp, muito provavelmente irão te orientar a verificar o collation do database e usar funções de cast para resolver.
O que não está necessáriamente errado, mas eu não gosto de complicar a minha vida e ficar procurando na documentação do banco de dados em questão como fazer essa budega.

Se você é como eu, se liga na simplicidade da solução, abra o nosso querido PDI:

  • Faça login no seu repositório;
  • Clique no “Explore Repository”;
  • Vá até a aba “Connections”;
  • Edite a conexão;
  • Em options, inclua o parâmetro: encoding | WIN1252;

Agora é só apertar o botão de OK e pronto!

Victor Bertoldo


6 Comments

Kelly · 2 de April de 2019 at 06:48

I like the article

    victorbertoldo · 2 de April de 2019 at 11:34

    Awesome! Thank You.

www.Ucgbc.org · 16 de April de 2019 at 22:30

Thanks for the great guide

Luisa · 17 de April de 2019 at 02:41

Thanks for the wonderful manual

Https://hampedia.org · 17 de April de 2019 at 04:18

I spent a great deal of time to find something like this

Www.Pocmicrosolutions.Com · 24 de April de 2019 at 19:28

This is truly helpful, thanks.

Leave a Reply

Your email address will not be published. Required fields are marked *