Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/28660
Autoria: Cordeiro, João Filipe Rala
Orientação: Postolache, Octavian
Data: 11-Mai-2023
Título próprio: Applied data science on children health & well-being
Referência bibliográfica: Cordeiro, J. F. R. (2022). Applied data science on children health & well-being [Tese de doutoramento, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/28660
ISBN: 978-989-781-875-2
Palavras-chave: Ciência de dados na saúde
eXplainable artificial intelligence
NAS e optimização de arquitecturas
Técnicas de ciência de dados para saúde
Contribuições para melhorar a saúde das crianças
Health data science
NAS and architectures optimization
Data science techniques for health
Children health improvements
Resumo: Todos os anos são gerados, em Portugal e no mundo em geral, enormes quantidades de dados relativos à saúde e ao dia-a-dia de um individuo. Desde os dados mais básicos como são exemplo o peso ou a altura, a informações decorrentes de situações de doenças, toma de fármacos ou sintomas, ou ainda resultados de diversos meios de diagnóstico complementares, como são exemplo as análises clínicas ou a ressonância magnética. Esses dados são tipicamente utilizados uma ou duas vezes, numa observação clínica e posteriormente guardados para não mais serem utilizados. Esta tese teve como objetivo investigar se é possível extrair valor e conhecimento a partir de "datasets" pré-existentes, obtidos e compilados em contextos de saúde, mas tendo como perspetiva outros projetos que não de ciência de dados. O derradeiro objetivo é o contributo para a saúde e bem-estar da nossa sociedade, começando desde logo pelas crianças. A tese concluiu que é de facto possível, recorrendo para isso a várias técnicas de data science e machine leaning entre as quais redes neuronais convolucionais, algoritmos de ensemble, inteligência artificial “explanibility”, pesquisa de arquiteturas de redes neurais entre outras técnicas. Por vezes existiu a necessidade de criar novos recursos (inexistentes na comunidade científica) para alcançar os objetivos propostos. Esses recursos foram posteriormente partilhados com a comunidade. Não obstante os recentes avanços na investigação nas áreas de machine learning e ciência de dados, e da abundância e (ainda em) expansão de recursos, a maioria dos projetos - se não todos - são concebidos a partir do zero ou com base em “datasets científicos”. Os dados existentes na área da saúde representam, na nossa opinião, uma vastidão de recursos subutilizados. A tese explorou e demonstrou a capacidade de derivar conhecimento e valor científico a partir de dados existentes, apresentado inclusive três casos de uso reais. Em todos casos foi possível endereçar questões científicas pertinentes e relevantes, como sejam as alterações cardiovasculares causadas pela obesidade infantil ou os fatores que influenciam as infeções neonatais hospitalares analisados nas dimensões de relevância e impacto. Durante esta investigação, foram criados e partilhados com a comunidade vários recursos. Estes recursos incluem a proposta de uma nova metodologia focada em ciência de dados na área da saúde, várias técnicas para explorar conjuntos de dados existentes, novas funcionalidades e expansões em bibliotecas de ciência de dados (ex: auto-skearn ou AutoKeras), ou métodos para otimizar arquiteturas de machine learning. A equipa de investigação tem a expectativa de que esta tese possa impulsionar novas iniciativas de ciência de dados no campo da saúde, inclusive em áreas não relacionadas com crianças.
Every year in Portugal and generally all over the world, enormous amounts of data are produced about a person's health and daily activities. Information resulting from disease situations, drug use or symptoms, the outcomes of various complementary diagnostic methods, like clinical analyses or magnetic resonance imaging, or simply data like weight or height. The typical usage pattern for such data is for one or two clinical observations, after which it is stored with no further use. This thesis sought to ascertain whether knowledge and value could be extracted from data that had previously been gathered in health contexts but not with data science projects in mind. The ultimate goal was to contribute to our society's health and well-being, starting from young ages. It was determined by the thesis that it is indeed feasible, using several data science and machine leaning techniques, such as convolutional neural networks, ensemble algorithms, explainable artificial intelligence, neural network architecture search and other advanced techniques. To accomplish the goals of the thesis, it was necessary to develop new resources (non-existent in the scientific community), which were then made available to the scientific community . Despite the recent advances in machine learning and data science research and the abundance of several and expanding resources, the majority of projects - if not all - are design from scratch or based on “scientific” datasets. The existing health data is, in our opinion, a vastly underutilised resource. The thesis has explored and demonstrated the ability of deriving scientific knowledge and insights from the available data, inclusive presenting three real-world use case. In all cases, pertinent and important scientific issues were addressed, such as the cardiovascular changes caused by childhood obesity, or the factors influencing neonatal hospital infections analysed in terms of relevance and impact. During this research, several resources where create and made available to the community. These resources include a new proposed methodology focused on health data science, several techniques for exploiting existing health datasets, new features and advancements in data science libraries (e.g.: auto-skearn or AutoKeras), or methods for optimizing machine learning architectures. The thesis team is very hopeful that this research will spur additional data science initiatives in the field of health, including those unrelated to children.
Designação do Departamento: Departamento de Ciências e Tecnologias da Informação
Designação do grau: Doutoramento em Ciências e Tecnologias da Informação
Arbitragem científica: yes
Acesso: Acesso Restrito
Aparece nas coleções:T&D-TD - Teses de doutoramento

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
phd_joao_rala_cordeiro.pdf
  Restricted Access
5,68 MBAdobe PDFVer/Abrir Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Este registo está protegido por Licença Creative Commons Creative Commons