{"id":75,"date":"2017-10-03T17:47:08","date_gmt":"2017-10-03T17:47:08","guid":{"rendered":"http:\/\/bufallos.com.br\/bg_br\/?p=75"},"modified":"2017-11-10T14:24:08","modified_gmt":"2017-11-10T14:24:08","slug":"conheca-etl","status":"publish","type":"post","link":"http:\/\/bufallos.com.br\/bg_br\/conheca-etl\/","title":{"rendered":"O que \u00e9 ETL? Um processo simples e poderoso para extra\u00e7\u00e3o de dados"},"content":{"rendered":"<p style=\"text-align: justify;\">J\u00e1 encontrei v\u00e1rias cita\u00e7\u00f5es sobre ETL na internet, especialmente quando comecei a ter necessidade de us\u00e1-lo em minhas demandas.<\/p>\n<p style=\"text-align: justify;\">Percebi que muitos divulgam o ETL como um Programa\/Software,<strong> o que n\u00e3o \u00e9 verdade<\/strong> por que ETL \u00e9 um processo de Extra\u00e7\u00e3o, Transforma\u00e7\u00e3o e Carga de dados.\u00a0 Veremos mais adiante informa\u00e7\u00f5es que esclarecer\u00e3o esta rela\u00e7\u00e3o.<\/p>\n<p style=\"text-align: justify;\">Al\u00e9m de falar sobre ETL, listarei as principais ferramentas do mercado e falarei um pouco sobre Mercado de trabalho.<\/p>\n<p style=\"text-align: justify;\">Mas, <strong>antes de partimos para o objetivo deste artigo<\/strong>, gostaria de contextualizar trazendo um pouco de minha descoberta com o ETL.<\/p>\n<p style=\"text-align: justify;\">Tudo come\u00e7ou alguns anos atr\u00e1s quando eu trabalhava numa empresa que fornecia servi\u00e7os de Log\u00edstica e Transportes, tendo servi\u00e7os de TI como parte integrante de seu portfolio.<br \/>\nComo n\u00f3s oferec\u00edamos tecnologia pr\u00f3pria para gerir o estoque e o transporte de cargas do cliente, n\u00f3s t\u00ednhamos que integrar nossos sistemas ao ERP do cliente para lan\u00e7ar dados referentes a\u00a0sua opera\u00e7\u00e3o.<\/p>\n<p style=\"text-align: justify;\">Logo no in\u00edcio todo processo era feito na m\u00e3o, <strong>mediante grandes cargas de dados<\/strong> ( eram Scripts SQL imensos), <strong>procedures, DBLinks<\/strong> entre outros recursos.\u00a0 Acontece que, com o tempo, as<br \/>\nopera\u00e7\u00f5es aumentaram e com isso come\u00e7amos a perceber que a performance dessas transa\u00e7\u00f5es estavam degradando nosso ambiente, al\u00e9m de,\u00a0 estarmos perdendo tempo gerenciando as cargas de dados.<\/p>\n<p style=\"text-align: justify;\">Foi quando descobri o Jitterbit, uma ferramenta que automatizava cargas de dados. Depois de estud\u00e1-la conseguimos automatizar todo fluxo de integra\u00e7\u00e3o de dados da empresa. Assim, o processo pegava dados em Fontes de dados ( que era definido junto ao cliente), tratava os dados conforme era necess\u00e1rio e lan\u00e7ava na base de destino.<\/p>\n<p style=\"text-align: justify;\">Continuei a estudar um pouco mais e descobri que eu n\u00e3o estava tendo avan\u00e7os por causa de uma ferramenta e sim por causa de um processo, o tal <strong>ETL.\u00a0<\/strong><\/p>\n<p style=\"text-align: justify;\"><strong>Mas o que vem a ser ETL ?<\/strong><br \/>\nETL \u00e9 uma sigla que representa Extract Transform Load (Extra\u00e7\u00e3o Transforma\u00e7\u00e3o Carregamento).<br \/>\n\u00c9 um processo onde n\u00f3s buscamos dados de uma fonte, transformamos este dado em um formato que nossa base de dados de destino possa entender \/ aceitar e entregamos os dados transformados para esta base, <strong>oferecendo o benef\u00edcio<\/strong> de integrar bancos de dados distintos ( SQL Server com Oracle por exemplo), proporcionar uma melhor performance, cargas programadas e gera\u00e7\u00e3o de arquivos em diversos formatos e layouts ( obedecendo a estrutura de dados que sistemas ERPs entendem).<\/p>\n<p style=\"text-align: justify;\">O Processo ETL \u00e9 comumente usado para Data Mart, Data Warehouse assim como outros sistemas.<\/p>\n<p style=\"text-align: justify;\">De forma geral, o ETL pode ser representado pela imagem abaixo:<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-79\" src=\"http:\/\/bufallos.com.br\/bg_br\/wp-content\/uploads\/2017\/10\/fluxoETL.png\" alt=\"\" width=\"672\" height=\"298\" srcset=\"http:\/\/bufallos.com.br\/bg_br\/wp-content\/uploads\/2017\/10\/fluxoETL.png 672w, http:\/\/bufallos.com.br\/bg_br\/wp-content\/uploads\/2017\/10\/fluxoETL-300x133.png 300w\" sizes=\"(max-width: 672px) 100vw, 672px\" \/><\/p>\n<p style=\"text-align: justify;\">No Wikipedia podemos ver defini\u00e7\u00f5es sobre ETL da seguinte forma:<\/p>\n<p style=\"text-align: justify;\">ETL, do ingl\u00eas Extract Transform Load (Extra\u00e7\u00e3o Transforma\u00e7\u00e3o Carregamento), \u00e9 um processo que \u00e9 utilizado por ferramentas de software cuja fun\u00e7\u00e3o \u00e9 a extra\u00e7\u00e3o de dados de diversos sistemas,<br \/>\ntransforma\u00e7\u00e3o desses dados conforme regras de neg\u00f3cios e por fim o carregamento dos dados geralmente para um Data Mart e\/ou Data Warehouse, assim como para um determinado sistema da<br \/>\norganiza\u00e7\u00e3o ( ou seja, n\u00e3o \u00e9 utilizado apenas para Data Warehouse e sim para v\u00e1rias finalidades).<\/p>\n<p style=\"text-align: justify;\">A extra\u00e7\u00e3o e carregamento s\u00e3o obrigat\u00f3rios para o processo, sendo a transforma\u00e7\u00e3o\/limpeza opcional (mas que s\u00e3o boas pr\u00e1ticas), tendo em vista que os dados j\u00e1 foram encaminhados para o<br \/>\nsistema de destino.\u00a0<strong>\u00c9 considerada uma das fases mais cr\u00edticas do Data Warehouse e\/ou Data Mart.<\/strong><\/p>\n<p style=\"text-align: justify;\">Os projetos de data warehouse consolidam dados de diferentes fontes. A maioria dessas fontes tendem a ser bancos de dados relacionais ou arquivo de texto (texto\u00a0 plano), podendo existir outras fontes.<\/p>\n<p style=\"text-align: justify;\">Atualmente, <strong>Existem v\u00e1rias ferramentas no mercado<\/strong> para trabalhar com ETL das quais destaco as seguintes:<\/p>\n<p style=\"text-align: justify;\"><strong>Oracle Data Integrator (ODI);<\/strong><br \/>\nMicrosoft Integration Server (MSIS);<br \/>\nIBM InfoSphere DataStage;<br \/>\nInform\u00e1tica Power Center;<br \/>\nSAP BusinessObjects Data Services;<br \/>\n<strong>Pentaho Data Integration<\/strong> \u00a0( esta tem vers\u00f5es free e muito boa de usar).<\/p>\n<p style=\"text-align: justify;\">Todas as ferramentas possuem a mesma finalidade que \u00e9 Coletar dados, transformar e entregar o resultado esperado. Costumo compar\u00e1-las com Carros. <strong>Todos fazem a mesma coisa que \u00e9 promover a locomo\u00e7\u00e3o, mas o que diferencia um do outro s\u00e3o os &#8220;caprichos&#8221; disponibilizados<\/strong>.<\/p>\n<p style=\"text-align: justify;\">Quanto ao <strong>MERCADO DE TRABALHO<\/strong>, analiso que estamos num bom momento j\u00e1 que Ci\u00eancia de dados est\u00e1 em alta.<br \/>\nDesta forma Voc\u00ea pode atuar, por exemplo, como :<br \/>\nAnalista de dados, Analista de BI e Analista de Integra\u00e7\u00e3o de Sistemas.<\/p>\n<p style=\"text-align: justify;\">Finalizo afirmando que, trabalhar com ETL \u00e9 estar numa \u00e1rea muito boa de trabalho e ampla j\u00e1 que voc\u00ea pode atuar em v\u00e1rias \u00e1reas.\u00a0 Caso esteja pensando na possibilidade, boa sorte.<\/p>\n<p style=\"text-align: justify;\">Fico por aqui. Tendo d\u00favidas, <a href=\"http:\/\/www.bufallos.com.br\/bg_br\/contato\/\" rel=\"noopener\">entre em contato.<\/a><\/p>\n<p style=\"text-align: justify;\">Forte abra\u00e7o.<\/p>\n<p style=\"text-align: justify;\">Eduardo Santana<strong><br \/>\n<\/strong>bufallos@bufallos.com.br<\/p>\n","protected":false},"excerpt":{"rendered":"<p>J\u00e1 encontrei v\u00e1rias cita\u00e7\u00f5es sobre ETL na internet, especialmente quando comecei a ter necessidade de us\u00e1-lo em minhas demandas. Percebi<\/p>\n","protected":false},"author":1,"featured_media":81,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/posts\/75"}],"collection":[{"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/comments?post=75"}],"version-history":[{"count":21,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/posts\/75\/revisions"}],"predecessor-version":[{"id":236,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/posts\/75\/revisions\/236"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/media\/81"}],"wp:attachment":[{"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/media?parent=75"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/categories?post=75"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/bufallos.com.br\/bg_br\/wp-json\/wp\/v2\/tags?post=75"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}