Business Intelligence (BI)

Business Intelligence (BI) pode ser traduzido como inteligência de negócios, ou inteligência empresarial. Isto significa que é um método que visa ajudar as empresas a tomar decisões inteligentes, mediante a coleta e processamento de dados, organização, análise, compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios, recolhidas pelos diversos sistemas de informação. Ou seja, é o conjunto de teorias, metodologias, processos, estruturas e tecnologias que transformam uma grande quantidade de dados brutos em informação útil para tomada de decisões estratégicas.
ANALISTA BUSINESS INTELLIGENCE (BI), no BRASIL é conhecido por outro nome junto ao Cadastro Brasileiro de Ocupações (CBO) do Ministério do Trabalho e Emprego (www.mtecbo.gov.br)

CBO 2124-05  Analista de desenvolvimento de sistemas

Sinônimos do CBO
  • 2124-05 – Analista de sistemas (informática)
  • 2124-05 – Analista de sistemas para internet
  • 2124-05 – Analista de sistemas web (webmaster)
  • 2124-05 – Consultor de tecnologia da informação
  • 2124-05 – Tecnólogo em análise de desenvolvimento de sistema
  • 2124-05 – Tecnólogo em processamento de dados
  • 2124-05 – Tecnólogo em sistemas para internet

 

Descrição Sumária

Desenvolvem e implantam sistemas informatizados dimensionando requisitos e funcionalidade dos sistemas, especificando sua arquitetura, escolhendo ferramentas de desenvolvimento, especificando programas, codificando aplicativos. administram ambiente informatizado, prestam suporte técnico ao cliente, elaboram documentação técnica. estabelecem padrões, coordenam projetos, oferecem soluções para ambientes informatizados e pesquisam tecnologias em informática.

Formação e Experiência

Para o exercício profissional dessas ocupações, requer-se curso superior completo, em nível de bacharelado ou tecnologia. Podem, também, obter formação específica por meio de cursos de qualificação, com carga horária entre duzentas e quatrocentas horas. A experiência profissional prévia requerida dos titulares para o exercício pleno das atividades é de um a dois anos, incluindo o tempo de estágio.em função da inovação tecnológica, a permanência no mercado de trabalho requer atualização contínua dos profissionais.

Condições Gerais de Exercício

Exercem suas atividades em qualquer setor da atividade econômica, tais como a indústria, o comércio, os serviços, a agropecuária ou a administração pública.podem trabalhar em empresas públicas ou privadas, em geral de médio e grande portes. seu trabalho se desenvolve, majoritariamente em equipe, de forma cooperativa, com supervisão ocasional. não há predominância de um tipo de vínculo de trabalho: os profissionais podem ser assalariados ou trabalhador por conta própria e trabalham em período diurno.

O Analista de Business Intelligence (ou Analista de BI) identifica analisando diversas informações armazenadas em banco de dados, quais são os padrões nos dados armazenados, e tendo como base estes padrões, ele propõe análises em relatórios gráficos ou por meio de laudos técnicos, que preveem o andamento de um determinado produto ou serviço ou comportamento de um determinado cliente. Assim, ele colabora com outras áreas da empresa tais como a área administrativa, financeira e de marketing.

Entre as tarefas exercidas pelo Analista Business Intelligence estão:

  • A configuração técnica de aplicações que realizem a análise de dados;
  • A definição de padrões e melhores práticas de desenvolvimento;
  • A documentação técnica de sistemas web e layout de projetos;
  • A elaboração de um cronograma do projeto e relatórios gerenciais;
  • Análise de requisitos, pesquisa e coleta de dados para tomada de decisões;
  • A gestão de projetos técnicos com liderança de equipes;
  • A negociação de contratos de terceirização de serviços técnicos;

 

O ANALISTA BUSINESS INTELLIGENCE  tem conhecimento técnico e experiência trabalhando com o seguinte:

  • Redes de Computadores (Windows Server ou Linux ou Unix)
  • Banco de Dados SQL (Microsoft SQL Server, Oracle SQL, MySQL)
  • Business Process Management (BPM) (Gestão de Processos)
  • Sistemas ERP (Sistemas de Gestão de Negócios Empresariais)
  • Administração de banco de dados BIG DATA e IoT (Internet das Coisas)
  • Organização & Métodos (O&M)
  • Análise de informações em banco de dados (Data Warehouse)
  • Modelagem lógica da estrutura de dados (informações)
  • Segurança das Informações (ABNT NBR ISO 27001/27002/27003)
  • Gerenciamento de Projetos (ABNT NBR ISO 21500)
  • Técnicas de Administração
  • Técnicas de Marketing de Conteúdo
  • Noções de Contabilidade e legislação
  • Estatística
  • Matemática Financeira

 

Para tornar-se um Analista de Business Intelligence é preciso ter ensino superior completo em área de Tecnologia da Informação, como em Engenharia da Computação ou Ciências da Computação, como ANALISTA DE SISTEMAS ou TECNÓLOGO EM PROCESSAMENTO DE DADOS, etc, e após ter concluído o curso superior, se cadastrar no Conselho Regional de Administração (CRA) para poder obter a carteira do registro profissional.

O mercado de trabalho para este profissional é bastante atrativo, uma vez que ele desempenha papel fundamental nas questões estratégicas da empresa, dando suporte técnico-administrativo para a tomada de decisões corretas, evitando assim possíveis riscos de falhas na execução dos projetos da empresa.

 

 Por:  ANA MERCEDES GAUNA  (14/09/2016)
ANALISTA DE SISTEMAS SENIOR | MANAGEMENT | MCSE | CCNA2
CRA-RJ: 03-03161 | ABRAWEB: 66132 | ABRACEM: Q27795 CONSULTOR TI

Construindo sua infraestrutura Big Data: 4 componentes chave que todo Business devem considerar

Bernard  Marr (@BernardMarr)

Building Your Big Data Infrastructure: 4 Key Components Every Business Needs To Consider (via Forbes em 15/06/2016)

http://www.forbes.com/sites/bernardmarr/2016/06/15/building-your-big-data-infrastructure-4-key-components-every-business-needs-to-consider/#eced7936a0b0

The scariest threat to the quality of IoT data and analytics

 

 

The scariest threat to the quality of IoT data and analytics

http://www.techrepublic.com/article/the-scariest-threat-to-the-quality-of-iot-data-and-analytics/

 

 

New Trends in Hi Tech by Ahmed Banafa

Ahmed Banafa

IoT Expert | Faculty | Author | Keynote Speaker

New Trends in Hi Tech by Ahmed Banafa

A blog about Internet of Things, Big Data, Mobility and Cloud Computing technologies

 

http://ahmedbanafa.blogspot.com.br/

Relatórios de Segurança da Internet 2016

http://www.cibersecurity.com.br/relatorio-cisco-de-seguranca-2016/

  • Transformação digital e combate ao cibercrime (via IBM BRASIL – ITFórum365) – 2016

http://itforum365.com.br/noticias/detalhe/119995/transformacao-digital-e-combate-ao-cibercrime?utm_campaign=website&utm_source=sendgrid.com&utm_medium=email

 

 

 

https://www.symantec.com/pt/br/security_response/publications/threatreport.jsp

 

  • Ransomware deve ser tratado como risco de negócio (via CIO em 13/07/2016)

  • Por isso, é importante criar um plano de resposta específico para ransomwares, antes que um ataque ocorra

http://cio.com.br/gestao/2016/07/13/ransomware-deve-ser-tratado-como-risco-de-negocio/

 

 

 

 

 

 

 

 

https://tecnoblog.net/127786/infraestrutura-internet-maior-ataque-ddos-historia/

Microsoft R Server 2016 = Big Data Analytics

microsoft-r-server

A Microsoft criou no início deste ano de 2016, o Microsoft R Server 2016 que já está disponível para download, e uma ferramenta dentro do Microsoft SQL Server 2016, para ser utilizada em conjunto com a linguagem R, para o usuário poder trabalhar com o Big Data Analytics.

Hardware recomendado (Microsoft SQL Server 2016): motherboard com processador Quad Core:  Intel Xeon E3 / Xeon E5 / Xeon E7 / Intel Core i7 ou AMD Athlon™ X4 Quad-Core

.

Microsoft R Server now available for Academics and Students via DreamSpark – big data statistics, predictive modeling and machine learning capabilities

Microsoft R Server (Developer Network)

R Services 2016 Getting Started Guide (MSDN Library)

Microsoft R Server 2016 – Big data analytics to the power of R (Download disponível para: Windows (x64), SUSE Linux (x64) , Red Hat Linux, Hadoop on Red Hat e Teradata DB).

Microsoft BIG Data: Windows Azure HDInsight general availability

R Services (SQL Server 2016) (Library MSDN)

SQL Server R Services (SQL Server 2016) (MSDN Library)

SQL Server R Services Tutorials (MSDN Library)

Por Ana Mercedes Gauna (30/04/2016)

O que os proprietários de empresas precisam saber sobre segurança e apropriação de dados

O que os proprietários de empresas precisam saber sobre segurança e apropriação de dados

 

Os dados certos tornou-se um dos mais importantes negócios ativos dos nossos tempos, e a pura explosão na quantidade e tipos de dados tem o poder de mudar completamente o forma como fazemos negócios. Mas ainda significativa apropriação e dilemas de segurança que empresários precisam estar cientes antes deles embarcarem em qualquer viagem para coletar e utilizar dados.
Obtendo a propriedade dos dados errados e segurança, isso pode ter consequências desastrosas. A União Europeia irá em breve ser capaz de multar empresas, com 5% do volume de negócios global, se começá-lo errado, mas mesmo apesar das multas, os danos à reputação pode ser imenso. Graças a mídia social, escândalos e violações podem viajar ao redor do mundo em um piscar de olhos, e reputações que levou anos para construir pode ser danificado em apenas alguns segundos.
Aqui estão algumas coisas principais que os proprietários de empresas devem considerar em torno de uma propriedade de dados, para ter segurança e transparência.
Pensar sobre Propriedade
Se você considerar dados como um ativo de negócioschave, ou seja, se o negócio se baseia em certos dados para realizar funções todos os dias, então é muito importante que você possui dados particulares.
Isto é fácil se for seus próprios dados internos, como é seu, mas fica mais complicado com quaisquer dados externos. Por exemplo, se você é dependente dos dados da outra parte para poder executar funções de negócioschave, e caso o fornecedor de seus preços lhe negar o acesso por qualquer motivo, você estará minado. Se você não poder possuir os dados que você está usando, e em seguida, você precisará ter certeza de que pelo menos você não vai perder o acesso aos dados.
Além disso, se você está confiando nos dados que os clientes têm fornecido a vocêentão você precisa estar ciente de que novas leis dão qualquer cidadão da União Europeia «o direito de ser esquecido» que significa que eles podem solicitar que apague todos os registros que você segurar sobre eles. Isso pode representar riscos significativos para as empresas que construíram seu modelo de negócio em torno de dados do cliente.
Proteja seus dados
Dados precisam ser protegidos como qualquer um dos seus outros ativos de negócios, como sua propriedade, seu estoque/mercadoria, sua ferragem, etc. Dependendo do tipo de dados que você está armazenando, pode haver normas de segurança e privacidade a seguir, particularmente quando se trata de dados pessoais.
Sempre que possível, tente usar dados anonimizados para que ele não identificar detalhes dos indivíduos. Onde isso não for possível, você precisa garantir que os dados são mantidos seguros e protegidos. Além de requisitos legais, existem razões de reputação e morais para garantir que os dados dos seus clientes são mantidos seguros.
Violações de dados podem levar a grandes prejuízos para as empresas e houve algumas falhas de perfil muito alto nos últimos anos, tais como o varejista americano alvo e telecomunicações britânicas companhia TalkTalk. Incidentes como este e os muitos outros dados em grande escala roubos que ocorrem com frequência mostram que mesmo as maiores empresas muitas vezes não conseguem manter as promessas que eles fazem sobre proteção de dados. Portanto, é essencial para proteger seus dados contra violações. Medidas sensatas incluem treinamento de seus funcionários para que eles nunca dão proteger informações, criptografia de dados e ter sistemas no lugar que detectar e impedir violações enquanto estão acontecendo. Segurança de dados é uma área altamente técnica e é sempre uma boa ideia procurar ajuda especializada.
Como um aparte, as pessoas costumavam se preocupar com a segurança dos dados armazenados na nuvem, mas, hoje em dia, muitas vezes é mais seguro que as empresas armazenar seus próprios dados internos. Sistemas de segurança da nuvem são geralmente muito mais atualizados e o fato de que os dados são armazenados em mais de um lugar fornece uma rede de segurança extra. Pessoalmente, eu recomendaria o armazenamento em nuvem como uma opção de seguro para as empresas.
Ser transparente
Infelizmente, muitas das práticas de coleta de dados não muito éticos. Facebook, por exemplo, enterra um monte de o que está fazendo com os dados em um acordo de usuário de 50 páginas que ninguém . Acho que é vital, que as empresas expliquem aos seus clientes o que eles estão coletando dos dados e como pretendem usálos. Ninguém gosta de descobrir que foi enganado!
Se você coletar informações pessoais sobre seus clientes ou funcionários, se sinceroExplica por que você está coletando informações (por exemplo, para que você possa entender suas necessidades mais plenamente e prestar um melhor serviço, como resultado).
Não enterre detalhes dados de usuários em longos acordos, ou termos e condições que ninguém vai ler. Mantêlo curto e fácil de entender, e colocar as informações em um lugar óbvio algumas frases quando clientes registrar seus detalhes para compras online seria um bom exemplo.
Finalmente, sempre dar aos clientes a oportunidade de optar por sair. Mesmo se isso significa que eles não podem usar seu serviço, ou partes de seu serviço, é muito melhor para lhes dar a escolha. Em última análise, isso torna os dados mais valiosos para você a longo prazo não é bom usar dados para entender mais sobre seus clientes, se deixam então em massa porque eles sentem que invadiram sua privacidade.
Agregar valor para seus clientes
Quando você está coletando dados sobre pessoas, não é importante ser honesto sobre isso, é uma boa ideia para adicionar valor para eles – algo que faz valer a pena. Que seja benéfico para as pessoas a compartilhar suas informações com o seu negócio, talvez através de produtos ou serviços, melhores ou mais baratos, para que eles sintam que é uma troca justa e vale a pena. Mire um ganha-ganha para todas as partes.
Se você fornecer valor a maioria das pessoas vai ser feliz para você usar seus dados   especialmente se você é capaz de remover marcadores pessoais que ligação-los como um indivíduo à informação. Em geral, se você puder demonstrar que você está usando os dados eticamente, pessoas responderão positivamente.
Empresários não deveriam ser colocados do usando dados as recompensas potenciais e oportunidades de crescimento de negócios são enormes. Mas é vital para agir eticamente e firmemente para bloquear seus dados. Este é um tópico que eu exploro com mais detalhes no meu novo livro Big Data for Small Business For Dummies.

Por Bernard Marr (25/04/2016)

Bernard Marr –Best-Selling Author, Keynote Speaker and Leading Business and Data Expert

What everyone should know about #BigData #ownership and #security | #DataScience   https://www.hiscox.co.uk/business-blog/business-owners-need-know-data-ownership-security/

Translate:  english – portuguese (PT-BR)

Artigo traduzido por Ana Mercedes Gauna (29/04/2016)

Top 10 EU #Privacy Regulation issues – #3 Did you run a privacy impact assessment?

Top 10 EU #Privacy Regulation issues – #3 Did you run a privacy impact assessment?

https://t.co/WtkaORZ7XU #GDPR #DataProtection

How The Citizen Data Scientist Will Democratize Big Data

How The Citizen Data Scientist Will Democratize Big Data

Bernard Marr

http://www.forbes.com/sites/bernardmarr/2016/04/01/how-the-citizen-data-scientist-will-democratize-big-data/?utm_campaign=ForbesTech&utm_source=TWITTER&utm_medium=social&utm_channel=Technology&linkId=22985503#2184f6854557

 

 

100 Active Blogs on Analytics, Big Data, Data Mining, Data Science, Machine Learning

100 Active Blogs on Analytics, Big Data, Data Mining, Data Science, Machine Learning |

http://www.kdnuggets.com/2016/03/100-active-blogs-analytics-big-data-science-machine-learning.html

17 Predictions About The Future Of Big Data Everyone Should Read

Bernard Marr – Forbes – Publicou em 15/03/2016

17 Predictions About The Future Of Big Data Everyone Should Read

http://www.forbes.com/sites/bernardmarr/2016/03/15/17-predictions-about-the-future-of-big-data-everyone-should-read/#2d306623157c

The 9 Best Marketing And Sales Analytics – Every Manager Should Know About

Bernard Marr – Forbes (23/02/2016)

The 9 Best Marketing And Sales Analytics – Every Manager Should Know About

http://www.forbes.com/sites/bernardmarr/2016/02/23/the-9-best-marketing-and-sales-analytics-every-manager-should-know-about/#2b9ab62b1818

The 18 Best Analytics Tools Every Business Manager Should Know

Bernard Marr – Forbes (04/02/2016)

The 18 Best Analytics Tools Every Business Manager Should Know

http://www.forbes.com/sites/bernardmarr/2016/02/04/the-18-best-analytics-tools-every-business-manager-should-know/#7dcdc2ca2c4a

Profissionais de Internet (Brazil)

Analista de Sistemas (Cientista de Dados BIG DATA)

É o profissional  Analista de Sistemas, especializado em BIG DATA, com formação superior completa e concluída em área de Ciência da Computação (ou similar), tem a responsabilidade de fazer pesquisas de caráter científico ou administrativo, utilizando uma grande quantidade de informações que estão armazenadas dentro de diversos banco de dados SQL do tipo BIG DATA, para diversas empresas. Esse profissional utiliza diversos métodos e técnicas para fazer a análise de informações. Tem certificações de especializações técnicas (diversos cursos concluídos) e conhecimento e competência para fazer auditoria e documentação técnica de projetos e sistemas, e conhecimentos de segurança das informações (ISO 27000), e tendo a certificação em cloud computing (curso concluído), tem conhecimentos suficientes e está capacitado a fazer online na internet a configuração cloud computing de domínios de websites.

  • PROJETO DE LEI DO SENADO nº 607, de 2007 – Regulamentação da profissão de Analista de Sistemas =

http://www25.senado.leg.br/web/atividade/materias/-/materia/82918

Desenvolvedor Web
É o profissional (antigo Programador de Computador) especializado em programação web, é o profissional que tem a responsabilidade de fazer a programação do código fonte que será utilizado na página Web. Código fonte é a programação utilizando a sintaxe de diversas linguagens de programação web (HTML5, PHP, Bootstrap, Java, Javascript, Python, etc), em conjunto com a programação de banco de dados SQL.
WebDesigner
É o profissional de Design que faz a editoração eletrônica de imagens, o desenho das imagens,  o desenho das ilustrações, o desenho de layouts, o desenho de logotipos, o desenho de logomarcas, o desenho de lettering, etc, que serão utilizados dentro das páginas web, trabalham utilizando software de desenho. No Brazil a profissão de Designer exige curso superior de Design concluído (ou experiência devidamente comprovada, antes da data da legislação específica entrar em vigor).
Webmaster
É o profissional de computação que define como será feito o layout final de um website, é quem tem experiência em navegar e trabalhar utilizando diversos domínios internacionais na internet, tem experiência com linguagens de programação em desenvolvimento web, tem diversas certificações de especializações técnicas (diversos cursos concluídos), e tendo a certificação em cloud computing (curso concluído), tem conhecimentos suficientes e está capacitado a fazer online na internet a configuração cloud computing de domínios de websites.


DBA (Administrador de Banco de Dados)

É o profissional que tem a certificação como administrador de banco de dados + certificação de administração de servidor + conhecimentos TCP/IP, com o curso técnico completo e concluído. O DBA tem a responsabilidade de gerenciar as informações existentes dentro do banco de dados, tem competência para instalar e configurar as características que serão definidas como o padrão que será utilizado dentro do banco de dados. O profissional DBA faz o gerenciamento e a administração das informações que estão armazenadas dentro do banco de dados, utilizando a programação com SQL, para criar relatórios administrativos e financeiros. Ele tem que ter conhecimentos de administração de servidor de rede de computador e servidor de banco de dados, e conhecimentos de segurança das informações (ISO 27000), e tendo a certificação em cloud computing (curso concluído), tem conhecimentos suficientes e está capacitado a fazer online na internet a configuração cloud computing de domínios de websites.

Gerente de Tecnologia da Informação (TI)

É o profissional formado como Cientista de Dados (Analista de Sistemas), com formação superior completa e concluída, em área de Ciência da Computação (ou similar) , tem experiência com desenvolvimento web, tem certificações técnicas, e experiência com cloud computing, tem experiência com navegação em banco de dados do tipo BIG DATA para realizar pesquisas e analisar informações, e conhecimentos de segurança das informações (ISO 27000), tem experiência com tarefas de caráter administrativo e financeiro, tem noções de matemática financeira, contabilidade e legislação brasileira, faz o gerenciamento de pessoas e projetos, e tem total autonomia para tomar decisões (caso o dono da empresa assim autorize). E tendo a certificação em cloud computing (curso concluído), tem conhecimentos suficientes e está capacitado a fazer online na internet a configuração cloud computing de domínios de websites.

Analista de Marketing Web

É o profissional formado em comunicação, publicidade e marketing, com formação superior completa e concluída, com conhecimentos de e-commerce, tem conhecimento de técnicas de publicidade e marketing digital, utiliza marketing de conteúdo, faz a elaboração de campanhas e vinhetas publicitárias, faz a editoração eletrônica de imagens e vídeos para veiculação em sites da internet e veiculação em redes sociais.

 

Conforme o grau de experiência profissional:
  • Profissionais Junior (JR) tem até 5 anos de experiência de trabalho profissional com carteira assinada (CLT), tem ensino médio completo e concluído, tem cursos técnicos concluídos (ou são recém-graduados em curso superior (completo e concluído), tem certificações técnicas profissionais, eles executam  tarefas e procedimentos simples, que não exigem profundo conhecimento técnico.
  • Profissionais Pleno (PL) tem de 6 anos até 9 anos de experiência de trabalho profissional com carteira assinada (CLT), tem ensino médio concluído, tem curso técnico concluído, tem curso superior concluído (ou são Pós-graduados) em tecnologias específicas, tem certificações técnicas profissionais que exigem profundo conhecimento técnico. Podem tomar decisões endossadas por um superior (Gerente ou Diretor da empresa, caso o dono da empresa assim autorize).

 

  • Profissionais Sênior (SR) tem experiência de trabalho profissional superior a 10 anos com carteira assinada (CLT), tem ensino superior concluído (ou são Pós-graduados), tem certificações técnicas profissionais, tem total autonomia para tomar decisões (caso o dono da empresa assim autorize). Age com base no conhecimento e experiências adquiridos ao longo da carreira. Administra pessoas e projetos.
  • Profissionais Master, tem mais de 15 anos de experiência de trabalho profissional com carteira assinada (CLT), tem ensino superior concluído (ou são Pós-graduados), tem diversas certificações técnicas profissionais, podem administrar e gerenciar projetos de processos de desenvolvimento de trabalhos. Atuam fora do processo de supervisão, possuem autonomia plena para tomar decisões (caso o dono da empresa assim autorize).

 

Por  Ana Mercedes Gauna (27/02/2016)
Senior System Analist | MCSE | MCDBA | CCNA2 | Webmaster | Management
27 anos de experiência profissional (CLT) | Rio de Janeiro/RJ  | Brazil

BIG DATA – Data Science

data scienceData-Science-Skillset1 (R)

About Data Scientists

Rising alongside the relatively new technology of big data is the new job title data scientist. While not tied exclusively to big data projects, the data scientist role does complement them because of the increased breadth and depth of data being examined, as compared to traditional roles.

So what does a data scientist do?

A data scientist represents an evolution from the business or data analyst role. The formal training is similar, with a solid foundation typically in computer science and applications, modeling, statistics, analytics and math. What sets the data scientist apart is strong business acumen, coupled with the ability to communicate findings to both business and IT leaders in a way that can influence how an organization approaches a business challenge. Good data scientists will not just address business problems, they will pick the right problems that have the most value to the organization.

The data scientist role has been described as “part analyst, part artist.” Anjul Bhambhri, vice president of big data products at IBM, says, “A data scientist is somebody who is inquisitive, who can stare at data and spot trends. It’s almost like a Renaissance individual who really wants to learn and bring change to an organization.”

Whereas a traditional data analyst may look only at data from a single source – a CRM system, for example – a data scientist will most likely explore and examine data from multiple disparate sources. The data scientist will sift through all incoming data with the goal of discovering a previously hidden insight, which in turn can provide a competitive advantage or address a pressing business problem. A data scientist does not simply collect and report on data, but also looks at it from many angles, determines what it means, then recommends ways to apply the data.

Data scientists are inquisitive: exploring, asking questions, doing “what if” analysis, questioning existing assumptions and processes. Armed with data and analytical results, a top-tier data scientist will then communicate informed conclusions and recommendations across an organization’s leadership structure.

Fonte:  IBM.COM = http://www-01.ibm.com/software/data/infosphere/data-scientist/

============================================================================================

Analytics, Data Mining, Data Science Expert, KDnuggets President

Which Big Data, Data Mining, and Data Science Tools go together?
https://www.linkedin.com/pulse/which-big-data-mining-science-tools-go-together-piatetsky-shapiro?trk=hp-feed-article-title-share

More Free Data Mining, Data Science Books and Resources
https://www.linkedin.com/pulse/more-free-data-mining-science-books-resources-piatetsky-shapiro?trk=mp-reader-card

The list below based on the list compiled by Pedro Martins, but we added the book authors and year, sorted alphabetically by title, fixed spelling, and removed the links that did not work.

  1. An Introduction to Data Science by Jeffrey Stanton, Robert De Graaf, 2013.
    An introductory level resource developed by Syracuse University
  2. An Introduction to Statistical Learning: with Applications in R by G. Casella, S, Fienberg, I Olkin, 2013.
    Overview of statistical learning based on large datasets of information. The exploratory techniques of the data are discussed using the R programming language.
  3. A Programmer’s Guide to Data Mining by Ron Zacharski, 2012.
    A guide through data mining concepts in a programming point of view. It provides several hands-on problems to practice and test the subjects taught on this online book.
  4. Bayesian Reasoning and Machine Learning by David Barber, 2012.
    focusing on applying it to machine learning algorithms and processes. It is a hands-on resource, great to absorb all the knowledge in the book.
  5. Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners by Jared Dean, 2014.
    On this resource the reality of big data is explored, and its benefits, from the marketing point of view. It also explains how to storage these kind of data and algorithms to process it, based on data mining and machine learning.
  6. Data Mining and Analysis: Fundamental Concepts and Algorithms by Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014.
    A great cover of the data mining exploratory algorithms and machine learning processes. These explanations are complemented by some statistical analysis.
  7. Data Mining and Business Analytics with R by Johannes Ledolter, 2013.
    Another R based book describing all processes and implementations to explore, transform and store information. It also focus on the concept of Business Analytics.
  8. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management by Michael J.A. Berry, Gordon S. Linoff, 2004.
    A data mining book oriented specifically to marketing and business management. With great case studies in order to understand how to apply these techniques on the real world.
  9. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery by Graham Williams, 2011.
    The objective of this book is to provide you lots of information on data manipulation. It focus on the Rattle toolkit and the R language to demonstrate the implementation of these techniques.
  10. Gaussian Processes for Machine Learning by Carl Edward Rasmussen and Christopher K. I. Williams, 2006.
    This is a theoretical book approaching learning algorithms based on probabilistic Gaussian processes. It’s about supervised learning problems, describing models and solutions related to machine learning.

Read the full post on KDnuggets: http://www.kdnuggets.com/2015/03/free-data-mining-data-science-books-resources.html

=======================================================================================

Kirk Borne
Principal Data Scientist at Booz Allen Hamilton

Data Science Declaration for 2015
https://www.linkedin.com/pulse/data-science-declaration-2015-kirk-borne?trk=mp-reader-card

Big Data Complexity Requires Fast Modeling Technology
https://www.linkedin.com/pulse/big-data-complexity-requires-fast-modeling-technology-kirk-borne?trk=mp-reader-card

With Prescriptive Analytics, the future ain’t what it used to be
https://www.linkedin.com/pulse/prescriptive-analytics-future-aint-what-used-kirk-borne?trk=hp-feed-article-title-share

Recomendação de Bibliografia Data Science = Kirk Borne@KirkDBorne Download 50+ Free #DataScience Books:http://bit.ly/1Or1j5Z  #abdsc #BigData #Analytics

Very interesting compilation published here, with a strong machine learning flavor (maybe machine learning book authors – usually academics – are more prone to making their books available for free). Many are O’Reilly books freely available. Here we display those most relevant to data science. I haven’t checked all the sources, but they seem legit. If you find some issue, let us know in the comment section below. Note that at DSC, we also have our free books:

There are several sections in the listing in question:

  1. Data Science Overviews (4 books)
  2. Data Scientists Interviews (2 books)
  3. How To Build Data Science Teams (3 books)
  4. Data Analysis (1 book)
  5. Distributed Computing Tools (2 books)
  6. Data Mining and Machine Learning (29 books)
  7. Statistics and Statistical Learning (5 books)
  8. Data Visualization (2 books)
  9. Big Data (3 books)

Here we mention #1, #5 and #6:

Data Science Overviews

Distributed Computing Tools

Data Mining and Machine Learning

========================================================================================

Bernard Marr é um LinkedIn Influencer

Best-Selling Author, Keynote Speaker and Leading Business and Data Expert

4 Things Big Data Can Do, and 3 Things It Can’t Do #bigdata http://ow.ly/3yjonn
http://data-informed.com/4-things-big-data-can-do-and-3-things-it-cant-do/

4 Ways Big Data Will Change Every Business | SmartData Collectivehttp://www.smartdatacollective.com/bernardmarr/349932/4-ways-big-data-will-change-every-business

Big Data Decision Against Facebook: Implications For Google, Apple and 5,000 Other Companies
https://www.linkedin.com/pulse/big-data-decision-against-facebook-implications-google-bernard-marr?trk=hp-feed-article-title-channel-add

==========================================================================================

Here Are the Schools With Degrees in Data Science [List]

http://bostinno.streetwise.co/2015/10/15/best-us-schools-for-data-science-colleges-degrees-in-data-science/?utm_content=bufferce60d&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer

According to a recent report released by RJMetrics called The State of Data Science, there are 11,400 self-identifying Data Scientists on LinkedIn. The organization made it clear that it would only count people who proclaim to be data scientists, rather than going through a painstaking process of determining which skill sets made someone this type of professional and which did not.

Although RJMetrics anticipates that the number it came up with is a wild underestimate, it still shows a steep and recent increase. The report explains that its findings indicate that 52% of data scientists have entered the field within the past four years—meaning that colleges with degrees in data science are becoming an increasing focus. Given that, the question for many becomes: what are the best U.S. schools for data science and the ideal paths toward this sort of career?

“The demand is clearly there, as data science students are finding many job offers when they graduate and in a diverse marketplace.” 

As you can imagine, because this niche but growing field is so new that most of the professionals don’t have educational backgrounds specific to Data Science. For the most part, data scientists have earned higher degrees – master’s and PhDs – but the subjects are all across the board. To be expected, the most popular courses of study are STEM-related. RJMetrics revealed that the top disciplines for data scientists with master’s degrees are Computer Science, Business Administration and Statistics. Meanwhile, for professionals holding PhDs, Physics, Computer Science and Mathematics are the most prevalent concentrations.

Schools are stepping up for Data Science

That being said, universities across the country are picking up on Data Science’s growing importance. Nowadays, businesses – regardless of their industry – are looking to accumulate, analyze and apply data to drive success in their space. To do that, it’s becoming key for employers to get their hands on Data Science talent. Select schools are stepping up and designing programs catered to developing students to thrive in this field.

There are Data Science – or something similarly named like Business Analytics or Data Mining – programs popping up in every U.S. state. In Massachusetts, schools like UMass and Worcester Polytechnic Institute (WPI), are among some of the first Data Science program pioneers.

“The demand is clearly there, as data science students are finding many job offers when they graduate and in a diverse marketplace,” said Elke Rundensteiner, professor at WPI — which has rolled out both a master’s and PhD program in Data Science in the past two years. “We are hearing from employers from marketing to cybersecurity to the pharmaceutical industry who have various data science needs. WPI has responded by digging deeper, offering more specific courses, and finding new intersections between disciplines.”

Because the field is so new and it’s being applied in so many different ways, universities are creating curricula that encompass a variety of disciplines needed to excel in Data Science. Most tracks are a melange of mathematics and IT, as well as business and computer sciences.

UMass' Dedication to STEM Meets Massachusetts Economy’s Demand for High-Tech WorkforceUMass’ Dedication to STEM Meets Massachusetts Economy’s Demand for…

Schools aren’t solely focused on letting students earn degrees in this field. Universities around the country also know they play a crucial role in the Data Science community itself – namely, in its development.

“The demand for new methods and tools for big data is also growing,” explained Andrew McCallum, director and professor at UMass’ Center of Data Science. “Data science centers, like ours at UMass Amherst, bring the data users – industry and government – together with the data science researchers to create new technologies resulting in better decision making and the discovery of new knowledge.”

Where to go

UMass and WPI are hardly alone in jumping on the Data Science educational bandwagon. Here’s a comprehensive list of U.S. universities offering degree programs specifically in this emerging subject (with links to each school’s specific data-science program):

Arizona State University W.P. Carey School of Business – Tempe, AZ

University of California Berkeley – Berkeley, CA

Chapman University – Orange, CA

Stanford – Stanford, CA

University of California San Diego – San Diego, CA

University of the Pacific – San Francisco, CA

University of Southern California – Los Angeles, CA

University of San Francisco – San Francisco, CA

Central Connecticut State University (CCSU) – New Britain, CT

University of Connecticut – Storrs, CT

American Sentinel University – Aurora, CO

University of Denver – Denver, CO

University of Central Florida – Orlando, FL

Catholic University of America – Washington, DC

George Washington University – Washington, DC

Georgetown University – Washington, DC

University of Iowa Tippie College of Business – Iowa City, IA

DePaul University – Chicago, IL

Illinois Institute of Technology – Chicago, IL

Northwestern University – Evanston, IL

University of Illinois Chicago Liautaud – Chicago, IL

University of Illinois at Urbana-Champaign – Urbana-Champaign, IL

University of Chicago Graham School – Chicago, IL

Indiana University Kelley School of Business – Bloomington, IN

Notre Dame – Notre Dame, IN

Purdue – Lafayette, IN

Saint Mary’s College – Notre Dame, IN

Northern Kentucky University – Highland Heights, KY

Lousiana State University – Baton Rouge, LA

Bentley – Waltham, MA

Brandeis – Waltham, MA

Harvard – Cambridge, MA

UMass Amherst Center for Data Science – Amherst, MA

WPI – Worcester, MA

University of Maryland – College Park, MD

Michigan State University – East Lansing, MI

University of Michigan Dearborn – Dearborn, MI

Winona State University – Winona, MN

University of Minnesota – Minneapolis, MN

North Carolina State University – Raleigh, NC

Saint Peter’s University – Jersey City, NJ

Rutgers – New Brunswick, NJ

Stevens Institute of Technology – Hoboken, NJ

Columbia New York, NY

Cornell – Ithaca, NY

Fordham – New York, NY

NYU – New York, NY

NYU Center for Data Science – New York, NY

Pace University – New York, NY and Westchester, NY

RPI – Troy, NY

Syracuse – Syracuse, NY

University of Rochester Institute for Data Science – Rochester, NY

The Ohio State University – Columbus, OH

University of Cincinnati – Cincinnati, OH

Xavier University – Cincinnati, OH

University of Oklahoma – Norman, OK

Carnegie Mellon University – Pittsburgh, PA

Drexel University – Philadelphia, PA

Saint Joseph’s University – Philadelphia, PA

College of Charleston – Charleston, SC

University of Tennessee – Knoxville, TN

Texas A&M University – Houston, TX

University of Texas Austin – Austin, TX

University of North Texas College of Business Information Technologies and Decision Sciences Center – Denton, TX

George Mason University – Fairfax, VA

Virginia Commonwealth University – Richmond, VA

University of Virginia – Charlottesville, VA

BIG DATA – SQL (manutenção anual)

sql manutenção

Em 2000, eu era DBA (administradora de banco de dados), usei um sistema ERP junto com Microsoft Windows NT4 Server + Microsoft  SQL 6.5 Server, e alguns anos depois passei a usar o Microsoft Windows 2000 Server + Microsoft SQL 2000 Server.  Nessa época,  meu  trabalho  semanal  era  fazer o  backup em fitas  DAT (HP), quando  era necessário, para reparar algum problema que tenha acontecido com dados, eu fazia o restauro dos dados.    ERP = Software de Departamento Pessoal (Recursos Humanos = Lei CLT) + Software de Contabilidade (Financeiro) + Software Imobiliário (Condomínio)

Lembrete:  Depois alguns anos usando um sistema ERP com banco de dados SQL, eu notei a que a execução dos dados dentro do sistema que utiliza o SQL,  ficou com a execução muito lenta, apresentando alguns erros de memória ou funcionando com muita inconsistência. Se quando comprar a placa de memória nova, e isso não resolver, o problema é outro:  isso pode ser causado quando o índice (chave) do banco de dados SQL apresenta defeito.

Exemplos de Servidores de Banco de Dados: Microsoft SQL Server 2008 + Microsoft SQL Server 2012 + Microsoft SQL Server 2014 + Microsoft Azure SQL Database + Oracle SQL Server + Oracle MySQL Server + Oracle PL/SQL + Oracle NoSQL Database + PostgreeSQL, etc.

Recomendação a fazer anualmente:

Primeiro passo: para consertar os índices (chave) que provavelmente estão defeituosos, é preciso recriar e re-organizar a tabela SQL (Structured Query Language).  Deve-se fazer um REINDEX (recriar os índices).   (Fiz isso anos atras no Microsoft SQL 2000 Server e funcionou muito bem).  Exemplos de sintaxe:  http://www.postgresql.org/docs/8.1/static/sql-reindex.html , no Microsoft Developer Network em DBCC DBREINDEX (Transact-SQL) , e no Oracle: http://docs.oracle.com/cd/E22583_01/UI/help/Utils/RSTU/REINDEX.html.

Segundo passo:  deve-se olhar o  SQL Memory Size  = Maximum server memory (MB) |  Mem Usage (MB)  | Virtual Size (MB) para  reconfigurar o valor default relativo a quantidade de memória mínima e memória máxima, que o SQL irá lêr dentro da execução do sistema (software).  Observações:  Microsoft  Developer  Network:  Opções Server Memory de configuração do servidor e Microsoft TechNet:  Enabling Memory Support for Over 4 GB of Physical Memory (fazer login com conta Hotmail ou Outlook), ou fazendo o login em Oracle Help Center (Database Administrator’s Guide) em Using Automatic Memory Management (page 45 of 299), e o exemplo de cálculo  = ¿cuantos bytes hay en 4GB, y como se calcula?

======================================================

* 4 gigabyte =4294967296 bytes

* bit es la unidad menor de medida de la informacion, entonces

* 8 bit = 1 bytes

* 1 byte (b)= unidad minima funcional (1 Byte = una letra)

* 1 Kilobyte (Kb)= 1 024 bytes (1 kB)

* 1 Megabyte (Mb)= 1 024 Kilobytes= 1 048 576 bytes (1 MB = una novela)

* 1 Gigabyte (Gb)= 1 024 Megabytes= 1 048 576 Kilobytes= 1 073 741 824 bytes (1GB)

* 1 Terabyte (Tb)= 1 024 Gigabytes= 1 048 576 Megabytes= 1 073 741 824 Kilobytes= 1 099 511 627 776 bytes (1Tb)

* 1 Petabyte (Pb)= 1 024 Terabytes= 1 048 576 Gigabytes= 1 073 741 824 Megabytes= 1 099 511 627 776 Kilobytes= 1 125 899 906 842 624 bytes

* 1 Exabyte (Eb) =  1 024 Petabytes = 1 048 576 Terabytes = 1 073 741 824 Gigabyte = 1 099 511 627 776 Megabyte  = 1 125 899 906 842 624 Kilobytes= 1 152 921 504 606 846 976 bytes

* 1 Zettabyte (Zb)= 1 024 Exabytes= 1 048 576 Petabytes= 1 073 741 824 Terabytes= 1 099 511 627 776 Gigabytes= 1 125 899 906 842 624 Megabytes= 1 152 921 504 606 846 976 Kilobytes= 1 180 591 620 717 411 303 424 bytes

* 1 Yottabyte (Yb)= 1 024 Zettabytes= 1 048 576 Exabytes= 1 073 741 824 Petabytes= 1 099 511 627 776 Terabytes= 1 125 899 906 842 624 Gigabytes= 1 152 921 504 606 846 976 Megabytes= 1 180 591 620 717 411 303 424 kilobytes= 1 208 925 819 614 629 174 706 176 bytes

* 1 Brontobyte(Bb)= 1 024 Yottabytes= 1 048 576 Zettabytes= 1 073 741 824 Exabytes= 1 099 511 627 776 Petabytes= 1 125 899 906 842 624 Terabytes= 1 152 921 504 606 846 976 Gigabytes= 1 180 591 620 717 411 303 424 Megabytes= 1 208 925 819 614 629 174 706 176 Kilobytes= 1 237 940 039 285 380 274 899 124 224 bytes

* 1 Geopbyte (Geb)= 1 024 Brontobytes= 1 048 576 Yottabytes= 1 073 741 824 Zettabytes= 1 099 511 627 776 Exabytes= 1 125 899 906 842 624 Petabytes= 1 152 921 504 606 846 976 Terabytes= 1 180 591 620 717 411 303 424 Gigabytes= 1 208 925 819 614 629 174 706 176 Megabytes= 1 237 940 039 285 380 274 899 124 224 Kilobytes= 1 267 650 600 228 229 401 496 703 205 376 bytes

Memory Size = Fonte(s): http://es.kioskea.net/forum/affich-59124…

======================================================

Usar o REINDEX + revisar o SQL Memory Size, anos atrás, isso feito, resolveu os problemas que existiam no sistema (software).

Eu estou estudando atualmente o Microsoft Windows Server 2012 + Microsoft Windows SQL Server 2012 (comprei os livros).  Algumas vezes eu faço login e estudo o manual do SQL, dentro do site Microsoft Technet em SQL Server Language Reference   .  (fazer login com conta Hotmail ou Outlook)

Observações (HTML5):

Meses atrás, estudando programação web responsiva em Bootstrap, eu testei online dentro do meu site amgauna.eti.br  (atualmente ele está guardado dentro do Registro.BR),  e notei naquela época que o código utf-8, ele não reconhecia todos os acentos, e nem reconhecia o cedilha, utilizados no idioma português-brasileiro.  Como no Brasil utilizamos 0 BR no domínio, eu testei, e a acentuação brasileira funcionou.   http://www.w3schools.com/charsets/ref_html_utf8.asp

No Brasil, no HTML5, deve-se utilizar utf-8-br (português-brasileiro), minha opinião, testei, experimentando Bootstrap, e funcionou a acentuação.

Por:  Ana Mercedes Gauna (09/10/2015)

https://anagauna.wordpress.com  |   https://about.me/anagauna

Senior System Analist | Webmaster | DBA | CCNA2 | ERP | Management

Rio de Janeiro/RJ – Brazil – 27 anos de experiência profissional (CLT)

BIG DATA – ANALYTICS

big data analitycs

Bunyamin Önel shared this Cisco Packet Tracer scenario

Acima, um desenho exemplo de layout do projeto de uma rede de computadores do  tipo BIG DATA.  Esse desenho foi feito utilizando o software Trace-Route utilizado pela Cisco Networking Academy da Cisco Systems.   Esse desenho de layout foi feito por Bunyamin Önel shared this Cisco Packet Tracer scenario…   (If you have ‪#‎PacketTracer‬ scenarios to share, send them over to netacadfb@gmail.com   with some info and we will share them on this page) – Anastasia at ‪#‎Cisco‬ https://lnkd.in/dMJu7Yd

Abaixo, meu resumo do estudo de BIG DATA – ANALYTICS, retirando um grau de complicação técnica, para simplificar o meu entendimento desse assunto.

DataScienceInformationInfrastructure

ANÁLISE DE DADOS (ESTATÍSTICA)

Os estudos estatísticos estão relacionados às situações que envolvem planejamentos, coleta de dados, organização de informações, análise das informações coletadas, interpretação e divulgação de forma clara e objetiva. Os métodos de pesquisa podem ser classificados de duas formas: pesquisas de opinião ou pesquisas de mercado. Nas pesquisas de opinião, o objetivo principal é colher informações sobre determinando assunto com base em entrevistas pessoais. As pesquisas de mercado são realizadas através da análise de mercado sobre determinado produto.

A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à Estatística Descritiva, enquanto a análise e a interpretação dos dados, associados a uma margem de incerteza, ficam a cargo da Estatística Indutiva ou Inferencial, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade.

A utilização de tabelas e gráficos são frequentes na Estatística. As tabelas servem para organizar e tabular os dados, já os gráficos transmitem as informações com clareza e transparência, contribuindo para uma leitura objetiva.

=============================================================================================

ANÁLISE DE DADOS  (SISTEMA DE INFORMAÇÕES)

ANÁLISE DE DADOS – O que é?

  • É o processo pelo qual se dá ordem, estrutura e significado aos dados (informações).
  • Consiste na transformação dos dados colectados em conclusões e/ou lições, úteis e verdadeiras.
  • A partir dos tópicos pré-estabelecidos processam-se os dados, procurando tendências, diferenças e variações nas informações obtidas.
  • Os processos, técnicas e ferramentas usadas são baseadas em certos pressupostos e como tal tem limitações.
  • O processo é utilizado para descrever e resumir os dados, identificar as relações e as diferenças existentes entre variáveis, comparar variáveis e fazer previsões.

ANÁLISE DE DADOS QUALITATIVO

  • Indaga o porque de determinado fato ou problema estar ocorrendo;
  • Estuda as motivações;
  • É indutivo;
  • Ajuda a definir hipóteses;
  • É exploratório;
  • Permite conhecer tendências, comportamentos, atitudes, etc;
  • Fornece informações detalhadas a tendências, atividades, etc;
  • Fornece informações detalhadas a perguntas ou problemas sobre um projeto ou atividade do mesmo;
  • Não permite inferir os resultados a toda uma população.
  • Descreve uma amostra populacional utilizando Tabelas de Frequências com sexo grupo etário e ocupação.
  • Organiza os comentários e as respostas em categorias similares (exemplo: preocupações, sugestões, pontos fortes, pontos fracos, etc)
  • Identificar os padrões, as tendências, as relações, bem como associações de causa-efeito.

FORMAS DE APRESENTAÇÃO DE DADOS QUALITATIVO:

  • Narrativas das respostas dos participantes
  • Diagramas de Causa-Efeito
  • Matrizes
  • Taxinomia
  • Diagrama de relações das várias categorias e o respectivo significado dado pelos participantes

TÓPICOS DO ROTEIRO E SEUS PRINCIPAIS OBJETIVOS QUALITATIVOS:

  • Identificar as características comuns ao grupo de trabalho, e as diferenças em relação aos outros grupos.
  • Inferir sobre os processos de socialização para o trabalho das cooperadas e se tais processos estariam associados, de algum modo, às formas como elas se percebem atualmente no trabalho.
  • Identificar as experiências comuns, a partir de sua inserção cooperativa, e seu impacto na vida pessoal, familiar e social

ANÁLISE DE DADOS QUANTITATIVO

  • Estuda as ações ou intervenções;
  • É dedutivo;
  • Fornece dados para provar hipóteses;
  • É conclusivo;
  • Mede o nível das intervenções, tendências, atividades, etc;
  • Produz informações quantificáveis sobre a magnitude de um problema, mas não fornece informações sobre o motivo do fato estar ocorrendo;
  • É possível inferir os resultados a toda uma população.
  • Utiliza-se os métodos estatísticos para representar os dados (informações)
  • Estatística descritiva envolve: coletar dados, apresentar dados e caracterizar dados, com a finalidade de descrever os dados.
  • Estatística inferencial envolve: estimativas e testes de hipóteses, com a finalidade de tomar decisões sobre as características de uma população a partir da amostra.

ETAPAS DA ANÁLISE DE DADOS QUANTITATIVOS

  • Organizar os dados, preocupando-se em dar uma ordem lógica aos dados, colocando todos os elementos da amostra e as variáveis em  estudo em uma tabela.
  • Agrupamento e resumo dos dados através de tabelas de frequências, exemplo: idade = (fi = ni / n)
  • Resumo das principais estatísticas (variável, média, mediana, moda, desvio padrão e variância)
  • Medidas de tendência central
  • Medidas de dispersão
  • Analisar e Interpretar os dados
  • Fazer o cruzamento de Tabelas (cross-tables)
  • Fazer uma análise de correlação

ANÁLISE E INTERPRETAÇÃO DOS DADOS QUANTITATIVOS

  • Geralmente, a análise e interpretação de dados envolve fazer comparações de grandezas estatísticas das varáveis de interesse.
  • As conclusões destas comparações baseiam-se na rejeição ou aceitação de hipóteses formuladas durante as questões avaliativas.
  • A aceitação ou rejeição de hipóteses baseia-se nos resultados obtidos nos chamados testes estatísticos.
  • Os testes mais usados são:  T-student , Chi-Quadrado e Anova
  • Baseline versus Resultados Alcançados: faz a  comparação da situação antes e após a implementação do programa.
  • Grupo Alvo versus Grupo de Controle: faz a comparação de atitudes ou práticas entre participantes e não participantes de um programa.
  • O grupo de tratamento – é um grupo de participantes da intervenção, cujas medidas de outcomes (resultado de equação lógica) são comparadas com às de um grupo de controle.
  • Controle grupo – é um grupo de “untreated” (não-tratados), cujo alvos que são comparados com grupos experimentais nos outcomes.

FERRAMENTAS PARA ANÁLISE DE DADOS (sistema de informações)

  • Atualmente existe diversas empresas de tecnologia que fornecem softwares para tratamento e análise de dados.

==============================================================================================

ANÁLISE DE DADOS = DATA SCIENCE

Exemplos de  Fórmula de CálculoGregory Piatetsky-Shapiro (Analytics, Data Mining, Data Science Expert, KDnuggets President) em  Which Big Data, Data Mining, and Data Science Tools go together?, e o artigo de   (Principal Data Scientist at Booz Allen Hamilton) em With Prescriptive Analytics, the future ain’t what it used to be 

Recomendação de Bibliografia Data ScienceGregory Piatetsky-Shapiro (Analytics, Data Mining, Data Science Expert, KDnuggets President) em More Free Data Mining, Data Science Books and Resources

The list below based on the list compiled by Pedro Martins, but we added the book authors and year, sorted alphabetically by title, fixed spelling, and removed the links that did not work.

  1. An Introduction to Data Science by Jeffrey Stanton, Robert De Graaf, 2013.
    An introductory level resource developed by Syracuse University
  2. An Introduction to Statistical Learning: with Applications in R by G. Casella, S, Fienberg, I Olkin, 2013.
    Overview of statistical learning based on large datasets of information. The exploratory techniques of the data are discussed using the R programming language.
  3. A Programmer’s Guide to Data Mining by Ron Zacharski, 2012.
    A guide through data mining concepts in a programming point of view. It provides several hands-on problems to practice and test the subjects taught on this online book.
  4. Bayesian Reasoning and Machine Learning by David Barber, 2012.
    focusing on applying it to machine learning algorithms and processes. It is a hands-on resource, great to absorb all the knowledge in the book.
  5. Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners by Jared Dean, 2014.
    On this resource the reality of big data is explored, and its benefits, from the marketing point of view. It also explains how to storage these kind of data and algorithms to process it, based on data mining and machine learning.
  6. Data Mining and Analysis: Fundamental Concepts and Algorithms by Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014.
    A great cover of the data mining exploratory algorithms and machine learning processes. These explanations are complemented by some statistical analysis.
  7. Data Mining and Business Analytics with R by Johannes Ledolter, 2013.
    Another R based book describing all processes and implementations to explore, transform and store information. It also focus on the concept of Business Analytics.
  8. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management by Michael J.A. Berry, Gordon S. Linoff, 2004.
    A data mining book oriented specifically to marketing and business management. With great case studies in order to understand how to apply these techniques on the real world.
  9. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery by Graham Williams, 2011.
    The objective of this book is to provide you lots of information on data manipulation. It focus on the Rattle toolkit and the R language to demonstrate the implementation of these techniques.
  10. Gaussian Processes for Machine Learning by Carl Edward Rasmussen and Christopher K. I. Williams, 2006.
    This is a theoretical book approaching learning algorithms based on probabilistic Gaussian processes. It’s about supervised learning problems, describing models and solutions related to machine learning.

Read the full post on KDnuggets: http://www.kdnuggets.com/2015/03/free-data-mining-data-science-books-resources.html

Gregory Piatetsky-Shapiro (Analytics, Data Mining, Data Science Expert, KDnuggets President)

===========================================================================================

Recomendação de Bibliografia Data Science = Kirk Borne@KirkDBorne Download 50+ Free #DataScience Books:http://bit.ly/1Or1j5Z  #abdsc #BigData #Analytics

Very interesting compilation published here, with a strong machine learning flavor (maybe machine learning book authors – usually academics – are more prone to making their books available for free). Many are O’Reilly books freely available. Here we display those most relevant to data science. I haven’t checked all the sources, but they seem legit. If you find some issue, let us know in the comment section below. Note that at DSC, we also have our free books:

There are several sections in the listing in question:

  1. Data Science Overviews (4 books)
  2. Data Scientists Interviews (2 books)
  3. How To Build Data Science Teams (3 books)
  4. Data Analysis (1 book)
  5. Distributed Computing Tools (2 books)
  6. Data Mining and Machine Learning (29 books)
  7. Statistics and Statistical Learning (5 books)
  8. Data Visualization (2 books)
  9. Big Data (3 books)

Here we mention #1, #5 and #6:

Data Science Overviews

Distributed Computing Tools

Data Mining and Machine Learning

============================================================================================

The information management big data and analytics capabilities include :

  • Data Management & Warehouse: Gain industry-leading database performance across multiple workloads while lowering administration, storage, development and server costs; Realize extreme speed with capabilities optimized for analytics workloads such as deep analytics, and benefit from workload-optimized systems that can be up and running in hours.
  • Hadoop System: Bring the power of Apache Hadoop to the enterprise with application accelerators, analytics, visualization, development tools, performance and security features.
  • Stream Computing: Efficiently deliver real-time analytic processing on constantly changing data in motion and enable descriptive and predictive analytics to support real-time decisions. Capture and analyze all data, all the time, just in time. With stream computing, store less, analyze more and make better decisions faster.
  • Content Management: Enable comprehensive content lifecycle and document management with cost-effective control of existing and new types of content with scale, security and stability.
  • Information Integration & Governance: Build confidence in big data with the ability to integrate, understand, manage and govern data appropriately across its lifecycle.

Fonte: IBM.COM = http://www-01.ibm.com/software/data/bigdata/

===========================================================================================

Por:  ANA MERCEDES GAUNA  (13/10/2015

https://anagauna.wordpress.com  |   https://about.me/anagauna

Senior System Analist | Webmaster | DBA | CCNA2 | ERP | Management

Rio de Janeiro/RJ – Brazil – 27 anos de experiência profissional (CLT)

BIG DATA – DataBase Definição

Santea Ioan from Romania of Network Layout Cisco Academy 20-10-2015

O desenho acima é o layout de “Santea Ioan, from #Romania, is currently studying #CCNA, she shared this Packet Tracer scenario that includes the following: IPV4, PV6, Subnetting, VLANs,  STP, VTP, Trunk and Access Ports, Port_Security, Etherchannel (PAGP), InterVLAN ROUTING,HSRP,Multi Area OSPF,Multi Area OSPFv3, DHCP Server, DNS Server, Email Server With POP3 AND SMTP Configured, Frame-Relay, and Extended ACLs“, em 19/10/2015. Esse desenho foi feito utilizando o Trace-Route do curso da Cisco Academy, e ela ilustra muito bem, um grau muito alto de complicação técnica de networking (rede de computadores).

Abdullah Hamdag Usman Tanggor pack tracer 118 Cisco Academy outubro2015

O desenho acima é o layout de “Abdullah Hamdag Usman Tanggor shared this Packet Tracer scenario covering:  DHCP, NAT, ETHER CHANNEL, PORT SECURITY, VLAN’s, Redundancy HSRP, RSTP+PVST…    (If you have ‪#‎PacketTracer‬ scenarios to share, send them over to netacadfb@gmail.com  with some info and we will share them on this page) – Anastasia at ‪#‎Cisco‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬”

Abaixo, o meu estudo, resumindo ao máximo o grau de complicação técnico, porque eu gosto de simplificar quase tudo o que é complicado de entender.

Definição prática de quais equipamentos e software, são utilizados para a construção do enorme volume de dados existentes em um Big Data.

Definição de BIG DATA:

Servidores de Banco de Dados: Microsoft SQL Server 2008 + Microsoft SQL Server 2012 + Microsoft SQL Server 2014 + Microsoft Azure SQL Database + Oracle SQL Server + Oracle MySQL Server + Oracle PL/SQL + Oracle NoSQL Database (JAVA) + SYBASE  (SAP), IBM DB2,  PostgreeSQL, por exemplo.

Servidores de Rede de Computadores (Mainframe Cloud Computing): Intel + Hewlett-Packard (HP) + FUJITSU, IBM + DELL + CISCO + SAMSUNG + ALOG (EQUINIX) + MANDIC + UOL, etc, por exemplo.

Sistema Operacional de Rede:  Microsoft Windows Server 2008 + Microsoft Windows Server 2012 + Microsoft Windows Server 2014 + Red Hat Linux + Mandriva Linux, Oracle Linux, etc, por exemplo.

Sistema Operacional de Rede Cloud Computing: Microsoft Windows Azure, Oracle Solaris (UNIX), por exemplo.

Oracle Sercer Zero Data Loss Recovery Appliance Experience at CERN

A  fotografia  acima  é  um  exemplo  de  Mainframe  (servidor  de  rede  de  computadores):  esta fotografia  é  um  dos mainframes da Oracle:  CERN  uses  Oracle  Zero  Data  Loss  Recovery  Appliance  to  back-up  and  restore  all  its  200 databases at a fast-paced and with minimum impact http://ora.cl/Lvz   and    https://plus.google.com/u/0/+AnaGauna2109/posts/ZUWES7VFfz6

Cada ano que passa, essa informação BIG DATA, tende a aumentar cada vez mais.

Para garantir a segurança da informação, e para proteger a privacidade das informações, hoje em dia existem várias técnicas modernas com certificações: AXELOS (ITIL), ISACA (COBIT|CISA), EXIN (Cloud Computing), CompTIA (Security), etc, por exemplo.  E a proteção que existe desde a década de 80, os antivírus Norton Internet Security (Symantec), McAfee LiveSafe (Intel Security), AVG Free, Avast Free, etc).

Hoje em dia o banco de dados SQL existe dentro dos servidores dos provedores de internet, que fornecem o serviço de uso disponível aos clientes.

Exemplos de BIG DATA:

Redes Sociais (login internacional):  todas as informações estão armazenadas dentro de diversos servidores de banco de dados SQL.

Bancos (login internacional):  todas as informações estão armazenadas dentro de diversos servidores de banco de dados SQL.

Youtube (login internacional): todos os videos disponíveis online estão armazenados em diversos servidores de banco de dados SQL.

Wikipédia (login internacional): todos os textos disponíveis online estão armazenados em diversos servidores de banco de dados SQL.

Wikipedia artigo de BIG Data:  https://en.wikipedia.org/wiki/Big_data

Observação:

Em 2000, eu era DBA (administradora de banco de dados), usei um sistema ERP junto com Microsoft Windows NT4 Server + Microsoft  SQL 6.5 Server, e alguns anos depois passei a usar o Microsoft Windows 2000 Server + Microsoft SQL 2000 Server.  Nessa época, meu trabalho semanal era fazer o backup em fitas  DAT (HP), quando  era necessário, para reparar algum problema que tenha acontecido com dados, eu fazia o restauro dos dados.    ERP = Software de Departamento Pessoal (Recursos Humanos = Lei CLT) + Software de Contabilidade (Financeiro) + Software Imobiliário (Condomínio)

Eu estou estudando atualmente o Microsoft Windows Server + Microsoft Windows SQL Server (comprei os livros).  Algumas vezes eu faço login e estudo o manual do SQL, dentro do site Microsoft Technet em SQL Server Language Reference   .  (fazer login com conta Hotmail ou Outlook)

Por Ana Mercedes Gauna ((estudo de Junho/2015 até Outubro/2015)
https://anagauna.wordpress.com  |   https://about.me/anagauna
Senior System Analist | Webmaster | DBA | CCNA2 | ERP | Management
Rio de Janeiro/RJ – Brazil – 27 anos de experiência profissional (CLT)