Open uri20190515 12756 1c1zbzx?1557932406
Data Scientist @ HealthySystems

Description

DATA SCIENTIST

De-identification as a Service (DiAS) é um projeto financiado pelo programa P2020 que visa desenvolver uma plataforma que faça a de-identificação de Big-data como um serviço, assegurando a conformidade com o RGPD e alavancando o mercado dos grandes volumes de dados. Pretendemos fornecer uma solução aos nossos clientes, que desejam explorar todo o potencial dos grandes volumes de dados, baseado no paradigma de privacidade por design facilitando o acesso às últimas técnicas de de-identificação, aproveitando assim a rápida implementação de controlos para garantir a privacidade por defeito.

Função a desempenhar:

Nos últimos anos foram desenvolvidas varias técnicas de de-identificação, no entanto, estas não são eficazes num mundo de grandes volumes de dados, já que foram desenhadas para proteger bases de dados de pequeno porte. No entanto, as empresas que fornecem serviços financeiros, saúde ou marketing geralmente dependem de dados de-identificados para análise e melhoria / desenvolvimento de produtos. O candidato contribuirá para a construção de uma plataforma inovadora de de-identificação tirando partido de todo o potencial de grandes volumes de dados

Tarefas a realizar:

  • Participar na estratégia, influenciar o roadmap e orientar as decisões do produto;
  • Auditoria/Introspeção de dados de modo a fazer recomendações pró-ativas sobre novos algoritmos de pseudo-anonimização.
  • Formular novas métricas para a avaliação dos algoritmos de pseudo-anonimização de dados setoriais, criando também dashboards para sua monitorização;
  • Desenvolver modelos e soluções de pseudo-anonimização baseados nos dados.

 

Quem procuramos:

  • Um profissional com sólidos fundamentos estatísticos;
  • Capaz de comunicar de forma clara para um público técnico e não técnico;
  • Conhecimentos de tecnologia de suporte a grandes volumes de dados (estruturados e não estruturados), tais como MapReduce, ElasticSearch, Hadoop, Hive e MogoDB;
  • Experiente na modelação de dados através machine learning (por exemplo, R, Python);
  • Sólida experiência em programação usando R, Python, Java ou C++;
  • Conhecimentos avançados em Excel e bases de dados relacionais e não relacionais;
  • Forte domínio em inglês escrito e falado.

Enviar CV para: [email protected]