Cursos de Jupyter for Data Science Teams
O Jupyter é um IDE interativo e um ambiente de computação de código aberto, baseado na Web.
Este treinamento ao vivo conduzido por instrutor (no local ou remoto) apresenta a ideia de desenvolvimento colaborativo em ciência de dados e demonstra como usar o Jupyter para rastrear e participar como uma equipe no "ciclo de vida de uma ideia computacional". Ele conduz os participantes através da criação de um projeto de ciência de dados de amostra baseado no topo do ecossistema Jupyter.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar o Jupyter, incluindo a criação e integração de um repositório de equipa no Git.
- Usar os recursos do Jupyter, como extensões, widgets interativos, modo multiusuário e muito mais para permitir a colaboração no projeto.
- Criar, partilhar e organizar Jupyter Notebooks com os membros da equipa.
- Escolher entre Scala, Python, R, para escrever e executar código contra sistemas de big data como Apache Spark, tudo através da interface Jupyter.
Formato do curso
- Palestra interactiva e discussão.
- Muitos exercícios e prática.
- Implementação prática num ambiente de laboratório ao vivo.
Opções de personalização do curso
- O Jupyter Notebook suporta mais de 40 idiomas, incluindo R, Python, Scala, Julia, etc. Para personalizar este curso para a(s) sua(s) língua(s) de eleição, por favor contacte-nos para combinar.
Programa do Curso
Introdução ao Jupyter
- Visão geral do Jupyter e do seu ecossistema
- Instalação e configuração
- Configurar o Jupyter para colaboração em equipa
Funcionalidades de colaboração
- Utilização do Git para controlo de versões
- Extensões e widgets interactivos
- Modo multiutilizador
Criar e gerir blocos de notas
- Estrutura e funcionalidade dos blocos de notas
- Partilhar e organizar blocos de notas
- Melhores práticas de colaboração
Programming com o Jupyter
- Escolher e utilizar linguagens de programação (Python, R, Scala)
- Escrever e executar código
- Integração com sistemas de grandes volumes de dados (Apache Spark)
Recursos avançados do Jupyter
- Personalização do ambiente Jupyter
- Automatizando fluxos de trabalho com o Jupyter
- Explorando casos de uso avançados
Sessões práticas
- Laboratórios práticos
- Projectos de ciência de dados do mundo real
- Exercícios de grupo e revisões por pares
Resumo e próximos passos
Requisitos
- Experiência Programming em linguagens como Python, R, Scala, etc.
- Experiência em ciência de dados
Público
- Equipas de ciência de dados
Os cursos de treinamento abertos exigem mais de 5 participantes.
Cursos de Jupyter for Data Science Teams - Booking
Cursos de Jupyter for Data Science Teams - Enquiry
Jupyter for Data Science Teams - Solicitação de Consultoria
Solicitação de Consultoria
Declaração de Clientes (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Curso - Jupyter for Data Science Teams
Próximas Formações Provisórias
Cursos Relacionados
Introduction to Data Science and AI using Python
35 HorasEste é um introdutório de 5 dias para Data Science e AI.
O curso é ministrado com exemplos e exercícios usando Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a participantes de nível intermediário que desejam automatizar e gerenciar fluxos de trabalho de aprendizado de máquina, incluindo treinamento de modelo, validação e implantação usando Apache Airflow.
No final deste treinamento, os participantes serão capazes de:
- Configurar Apache Airflow para orquestração de fluxo de trabalho de aprendizado de máquina.
- Automatizar tarefas de pré-processamento de dados, treinamento de modelos e validação.
- Integrar o Airflow com estruturas e ferramentas de aprendizado de máquina.
- Implantar modelos de aprendizado de máquina usando pipelines automatizados.
- Monitorar e otimizar fluxos de trabalho de aprendizado de máquina na produção.
Anaconda Ecosystem for Data Scientists
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados que desejam usar o ecossistema Anaconda para capturar, gerenciar e implantar pacotes e fluxos de trabalho de análise de dados em uma única plataforma.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar componentes e bibliotecas Anaconda.
- Compreender os principais conceitos, recursos e benefícios do Anaconda.
- Gerenciar pacotes, ambientes e canais usando o Anaconda Navigator.
- Usar pacotes Conda, R e Python para ciência de dados e aprendizado de máquina.
- Conhecer alguns casos de uso práticos e técnicas para gerenciar vários ambientes de dados.
AWS Cloud9 for Data Science
28 HorasEsse treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas e analistas de dados de nível intermediário que desejam usar o AWS Cloud9 para fluxos de trabalho de ciência de dados simplificados.
No final deste treinamento, os participantes serão capazes de:
- Configurar um ambiente de ciência de dados no AWS Cloud9.
- Realizar análise de dados usando Python, R e Jupyter Notebook no Cloud9.
- Integre o AWS Cloud9 aos serviços de dados da AWS, como S3, RDS e Redshift.
- Utilizar o AWS Cloud9 para desenvolvimento e implantação de modelos de aprendizado de máquina.
- Otimizar fluxos de trabalho baseados em nuvem para análise e processamento de dados.
Inteligência de Negócios de Big Data para Provedores de Serviços de Telecomunicações e Comunicação
35 HorasVisão geral
Communications provedores de serviços (CSP) estão enfrentando pressão para reduzir custos e maximizar o rendimento médio por usuário (ARPU), ao mesmo tempo que garantem uma excelente experiência de cliente, mas os volumes de dados continuam a crescer. O tráfego global de dados móveis crescerá a uma taxa de crescimento anual combinada (CAGR) de 78 por cento até 2016, atingindo 10,8 exabytes por mês.
Enquanto isso, os CSPs estão gerando grandes volumes de dados, incluindo registros de detalhes de chamadas (CDR), dados de rede e dados de clientes. As empresas que aproveitam plenamente esses dados ganham um limiar competitivo. De acordo com uma pesquisa recente da Economist Intelligence Unit, as empresas que usam tomada de decisões orientadas a dados desfrutam de um aumento de 5-6% na produtividade. No entanto, 53% das empresas usam apenas metade dos seus dados valiosos, e um quarto dos entrevistados notou que enormes quantidades de dados úteis vão sem acesso. Os volumes de dados são tão altos que a análise manual é impossível, e a maioria dos sistemas de software hereditário não pode manter-se, resultando em dados valiosos sendo descartados ou ignorados.
Com Big Data & Analytics’ software de big data de alta velocidade, escalável, os CSPs podem minar todos os seus dados para melhor tomada de decisão em menos tempo. Diferentes Big Data produtos e técnicas fornecem uma plataforma de software end-to-end para a recolha, preparação, análise e apresentação de insights de grandes dados. As áreas de aplicação incluem monitoramento de desempenho da rede, detecção de fraude, detecção de clientes e análise de risco de crédito. Big Data & Produtos de análise escala para lidar com terabytes de dados, mas a implementação dessas ferramentas requer um novo tipo de sistema de banco de dados baseado em nuvem como Hadoop ou processador de computação paralelo de escala massiva ( KPU etc.)
Este curso trabalha em Big Data BI para Telco cobre todas as novas áreas emergentes em que os CSPs estão investindo para aumentar a produtividade e abrir novos fluxos de receita de negócios. O curso fornecerá uma visão completa de 360 graus de Big Data BI em Telco para que os decisores e gerentes possam ter uma visão geral muito ampla e abrangente das possibilidades de Big Data BI em Telco para produtividade e ganho de receita.
Objetivos do curso
O objetivo principal do curso é introduzir novas Big Data técnicas de inteligência de negócios em 4 setores de Telecom Business (Marketing/Vendas, Operação de Rede, Operação Financeira e Relação com o Cliente Management). Os alunos serão introduzidos a seguir:
- Introdução a Big Data-o que é 4Vs (volume, velocidade, variedade e veracidade) em Big Data- Geração, extração e gerenciamento da perspectiva da Telco
- Como Big Data o analista difere do analista de dados de herança
- In-house justificação de Big Data -Prospectiva Telco
- Introdução a Hadoop Ecosistema- familiaridade com todas as Hadoop ferramentas como Hive, Pig, SPARC –quando e como eles são usados para resolver Big Data problema
- Como Big Data é extraído para analisar para a ferramenta de análise-como Business Analysis’s podem reduzir seus pontos de dor de recolha e análise de dados através de uma abordagem integrada Hadoop dashboard
- Introdução básica da análise de Insight, análise de visualização e análise preditiva para Telco
- Analítica do cliente e Big Data-como Big Data analítica pode reduzir o cliente e a insatisfação do cliente em estudos de caso Telco
- Análise de falhas de rede e de falhas de serviço a partir de metadados de rede e IPDR
- Análise financeira-fraude, vazamento e estimativa do ROI a partir de dados de vendas e operações
- Problemas de aquisição do cliente-Marketing Objetivo, Segmentação do cliente e Cross-Sales a partir de dados de vendas
- Introdução e resumo de todos os Big Data produtos analíticos e onde eles se encaixam no espaço analítico da Telco
- Conclusão-como tomar uma abordagem passo a passo para introduzir Big Data Business Intelligence em sua organização
Auditoria Objetiva
- Operação de rede, gerentes financeiros, gerentes de CRM e gerentes de TI de alto nível no escritório do Telco CIO.
- Business Analisadores em Telco
- Diretores de escritório / analistas
- Gestores Operacionais
- Gerenciadores QA
Introduction to Google Colab for Data Science
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados de nível iniciante e profissionais de TI que desejam aprender o básico da ciência de dados usando Go ogle Colab.
No final deste treinamento, os participantes serão capazes de:
- Configurar e navegar no Google Colab.
- Escrever e executar código básico Python.
- Importar e manipular conjuntos de dados.
- Criar visualizações usando bibliotecas Python.
A Practical Introduction to Data Science
35 HorasOs participantes que concluírem esta formação adquirirão um conhecimento prático e real da Data Science e das tecnologias, metodologias e ferramentas relacionadas.
Os participantes terão a oportunidade de pôr em prática estes conhecimentos através de exercícios práticos. A interação em grupo e o feedback do formador constituem uma componente importante da aula.
O curso começa com uma introdução aos conceitos elementares da Data Science, depois avança para as ferramentas e metodologias utilizadas na Data Science.
Público
- Programadores
- Analistas técnicos
- Consultores de TI
Formato do curso
- Parte palestra, parte discussão, exercícios e prática prática pesada
Nota
- Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.
Data Science for Big Data Analytics
35 HorasBig data é um conjunto de dados tão volumoso e complexo que os aplicativos tradicionais de processamento de dados são inadequados para lidar com eles. Os desafios do big data incluem a captura de dados, armazenamento de dados, análise de dados, pesquisa, compartilhamento, transferência, visualização, consulta, atualização e privacidade de informações.
Data Science essential for Marketing/Sales professionals
21 HorasEste curso é destinado a Marketing Profissionais de Vendas que pretendem se aprofundar na aplicação da ciência de dados em Marketing/ Vendas. O curso fornece cobertura detalhada de diferentes técnicas de ciência de dados usadas para “upsale”, “venda cruzada”, segmentação de mercado, branding e CLV.
Diferença entre Marketing e Vendas - Como é que vendas e marketing são diferentes?
Em palavras muito simples, as vendas podem ser denominadas como um processo que se concentra ou visa indivíduos ou pequenos grupos. Marketing, por outro lado, tem como alvo um grupo maior ou o público em geral. Marketing inclui pesquisa (identificar as necessidades do cliente), desenvolvimento de produtos (produção de produtos inovadores) e promoção do produto (através de anúncios) e conscientizar os consumidores sobre o produto. Como tal, marketing significa gerar leads ou clientes potenciais. Uma vez que o produto é lançado no mercado, é tarefa do vendedor persuadir o cliente a comprar o produto. Vendas significa converter leads ou clientes potenciais em compras e pedidos, enquanto o marketing visa prazos mais longos, as vendas referem-se a metas mais curtas.
Introduction to Data Science
35 HorasEste treinamento ao vivo, conduzido por instrutor (no local ou remoto), destina-se a profissionais que desejam iniciar uma carreira em Data Science .
Ao final deste treinamento, os participantes serão capazes de:
- Instale e configure Python e MySql.
- Entenda o que é Data Science e como ela pode agregar valor a praticamente qualquer negócio.
- Aprenda os fundamentos da codificação em Python
- Aprenda técnicas de Machine Learning supervisionadas e não supervisionadas e como implementá-las e interpretar os resultados.
Formato do Curso
- Palestra e discussão interativa.
- Muitos exercícios e prática.
- Implementação prática em um ambiente de laboratório ao vivo.
Opções de personalização do curso
- Para solicitar um treinamento personalizado para este curso, entre em contato conosco para agendar.
Kaggle
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam aprender e construir suas carreiras em Data Science usando Kaggle.
Ao final deste treinamento, os participantes serão capazes de:
- Aprender sobre ciência de dados e aprendizado de máquina.
- Explorar a análise de dados.
- Aprender sobre Kaggle e como ele funciona.
Data Science with KNIME Analytics Platform
21 HorasKNIME A Plataforma de Análise é uma opção de código aberto líder para a inovação baseada em dados, ajudando você a descobrir o potencial escondido em seus dados, minas para novas insights, ou prever novos futuros. Com mais de 1000 módulos, centenas de exemplos prontos para ser executados, uma ampla gama de ferramentas integradas e a mais ampla seleção de algoritmos avançados disponíveis, KNIME a Plataforma de Análise é a caixa de ferramentas perfeita para qualquer cientista de dados e analista de negócios.
Este curso para KNIME Plataforma de Análise é uma oportunidade ideal para iniciantes, usuários avançados e KNIME especialistas para ser introduzido a KNIME, para aprender como usá-lo de forma mais eficaz, e como criar relatórios claros e abrangentes com base em KNIME fluxos de trabalho
Este treinamento guiado por instrutores, ao vivo (online ou on-site) é dirigido a profissionais de dados que desejam usar KNIME para resolver necessidades de negócios complexas.
É direcionado para o público que não conhece a programação e pretende usar ferramentas de ponta para implementar cenários de análise
No final do curso, os participantes poderão:
- Instalar e configurar KNIME.
- Criação Data Science cenários
- Trânsito, testes e modelos validados
- Implementação final para a cadeia de valor final de modelos de ciência de dados
O formato do curso
- Interação e discussão interativa.
- Muitos exercícios e práticas.
- Implementação de mão em um ambiente de laboratório ao vivo.
Opções de Customização
- Para solicitar uma formação personalizada para este curso ou para saber mais sobre este programa, por favor contacte-nos para organizar.
MATLAB Fundamentals, Data Science & Report Generation
35 HorasNa primeira parte deste treinamento, abordamos os fundamentos de MATLAB e sua função como linguagem e plataforma. Incluída nesta discussão está uma introdução à sintaxe de MATLAB, matrizes e matrizes, visualização de dados, desenvolvimento de scripts e princípios orientados a objetos.
Na segunda parte, demonstramos como usar MATLAB para mineração de dados, aprendizado de máquina e análise preditiva. Para dar aos participantes uma perspetiva clara e prática da abordagem e do poder da MATLAB, estabelecemos comparações entre a utilização da MATLAB e a utilização de outras ferramentas, como folhas de cálculo, C, C++ e Visual Basic.
Na terceira parte da formação, os participantes aprendem a simplificar o seu trabalho, automatizando o processamento de dados e a criação de relatórios.
Ao longo do curso, os participantes colocarão em prática as ideias aprendidas através de exercícios práticos num ambiente de laboratório. No final da formação, os participantes terão um conhecimento profundo das capacidades de MATLAB e serão capazes de o empregar para resolver problemas reais de ciência de dados, bem como para agilizar o seu trabalho através da automatização.
As avaliações serão realizadas ao longo do curso para avaliar o progresso.
Formato do curso
- O curso inclui exercícios teóricos e práticos, incluindo discussões de casos, inspeção de código de amostra e implementação prática.
Nota
- As sessões práticas serão baseadas em modelos de relatório de dados de amostra pré-arranjados. Se tiver necessidades específicas, contacte-nos para combinarmos.
Accelerating Python Pandas Workflows with Modin
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas e desenvolvedores de dados que desejam usar Modin para criar e implementar cálculos paralelos com Pandas para uma análise de dados mais rápida.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente necessário para começar a desenvolver fluxos de trabalho Pandas em escala com Modin.
- Compreender os recursos, a arquitetura e as vantagens de Modin.
- Conhecer as diferenças entre Modin, Dask e Ray.
- Realizar operações Pandas mais rapidamente com Modin.
- Implementar toda a API Pandas e as funções.
GPU Data Science with NVIDIA RAPIDS
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam usar RAPIDS para construir pipelines de dados acelerados GPU, fluxos de trabalho e visualizações, aplicando algoritmos de aprendizado de máquina, como XGBoost, cuML, etc.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para construir modelos de dados com a NVIDIA RAPIDS.
- Compreender os recursos, componentes e vantagens de RAPIDS.
- Aproveite GPU para acelerar os pipelines de dados e análises de ponta a ponta.
- Implementar a preparação de dados acelerada por GPU e ETL com cuDF e Apache Arrow.
- Aprenda a executar tarefas de aprendizado de máquina com os algoritmos XGBoost e cuML.
- Crie visualizações de dados e execute análises de gráficos com cuXfilter e cuGraph.