Olá pessoinha! Vc que é da sofrência e gosta de usar ferramentas open source assim como eu, está passando por problemas de caracteres zoados no seu DW, Cubo, BI, etc?

Bom neste post vou mostrar como resolver uma treta do Pentaho Data Integration! Conhecido também como PDI, Kettle, Spon e Mother on the zone. Hahaha!

Pois bem, é muito comum no dia-a-dia de quem faz pipeline de dados ou cria modelos e fluxos de ETL com o PDI se deparar com a seguinte situação:

Temos uma tabela origem no legado, onde existem palavras com caracteres especiais como [áçõêì], resultando no famoso � ao carregar os dados na stage ou no DW. O que geralmente me deixa P… da vida.

Se você perguntar em um fórum ou grupo de Whatsapp, muito provavelmente irão te orientar a verificar o collation do database e usar funções de cast para resolver.
O que não está necessáriamente errado, mas eu não gosto de complicar a minha vida e ficar procurando na documentação do banco de dados em questão como fazer essa budega.

Se você é como eu, se liga na simplicidade da solução, abra o nosso querido PDI:

  • Faça login no seu repositório;
  • Clique no “Explore Repository”;
  • Vá até a aba “Connections”;
  • Edite a conexão;
  • Em options, inclua o parâmetro: encoding | WIN1252;

Agora é só apertar o botão de OK e pronto!

Victor Bertoldo


6 comentários

Kelly · 2 de abril de 2019 às 06:48

I like the article

    victorbertoldo · 2 de abril de 2019 às 11:34

    Awesome! Thank You.

www.Ucgbc.org · 16 de abril de 2019 às 22:30

Thanks for the great guide

Luisa · 17 de abril de 2019 às 02:41

Thanks for the wonderful manual

Https://hampedia.org · 17 de abril de 2019 às 04:18

I spent a great deal of time to find something like this

Www.Pocmicrosolutions.Com · 24 de abril de 2019 às 19:28

This is truly helpful, thanks.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *