Cookies
O website necessita de alguns cookies e outros recursos semelhantes para funcionar. Caso o permita, o INESC TEC irá utilizar cookies para recolher dados sobre as suas visitas, contribuindo, assim, para estatísticas agregadas que permitem melhorar o nosso serviço. Ver mais
Aceitar Rejeitar
  • Menu
Factos & Números
000
Apresentação

Laboratório de Inteligência Artificial e Apoio à Decisão

O LIAAD investiga na área estratégica de Data Science, que tem verificado um crescente interesse por todo o mundo, sendo fundamental para todas as áreas da atividade humana.

As enormes quantidades de dados recolhidos (Big Data) e a generalização de dispositivos com sensores e/ou poder de processamento oferecem cada vez mais oportunidades e desafios a cientistas e engenheiros.

Além disso, a procura por modelos complexos de apoio à decisão está a generalizar-se em áreas como negócios, saúde, ciência, governo eletrónico e e-learning, o que nos encoraja a investir em diferentes abordagens.

A nossa estratégia geral é tirar proveito do fluxo e diversificação de dados e investir em linhas de investigação que ajudarão a reduzir a lacuna entre dados recolhidos e dados úteis, oferecendo diversas soluções de modelação.

No LIAAD o trabalho científico centra-se nas seguintes áreas: machine learning, estatística, otimização e matemática.

Últimas Notícias
Inteligência Artificial

Combater crimes ambientais no transporte de resíduos: o INESC TEC tem a solução

O projeto EnSafe (Enhancing Environmental Protection: Anomaly Detection in Waste Transportation using Network Science) está a desenvolver soluções baseadas em Inteligência Artificial (IA) para reforçar o combate ao crime ambiental, com especial foco nas cadeias de transporte de resíduos. O EnSafe conta com a participação ativa do INESC TEC, que está a desenvolver tecnologias para detetar comportamentos anómalos e suspeitos numa das áreas mais vulneráveis à fraude e à corrupção ambiental.

26 maio 2025

Ciência e Engenharia dos Computadores

Consultar relatórios clínicos para apoiar decisões médicas será mais fácil com ferramenta premiada do INESC TEC

Apoiar os médicos na tomada de decisões clínicas complexas e raras é o propósito do MedLink, uma ferramenta desenvolvida por investigadores do INESC TEC, que venceu o Best Demo Paper na European Conference on Information Retrieval, uma das conferências mais prestigiadas da Europa na área de recuperação de informação.

08 maio 2025

Ciência e Engenharia dos Computadores

As variedades linguísticas com menor peso também têm espaço na era da IA – dois artigos INESC TEC em conferência de topo provam-no

É difícil conceber muitas das tecnologias ou inovações mais recentes sem o recurso a Modelos de Linguagem (ML) ou Processamento da Linguagem Natural (PLN). A sua presença e incorporação em diversas esferas da sociedade – algumas com muita relevância, como é o caso da esfera legal ou médica – tem levantado questões (e preocupações) que acabam muitas vezes a bater na mesma parede de interrogação: estarão as tecnologias baseadas em ML a abranger todas as comunidades? Recentemente, dois artigos científicos com assinatura INESC TEC – ambos aceites no AAAI, uma conferência A* – procuraram resolver alguns dos desafios que se vislumbram nesta nova era e que impactam diretamente a língua portuguesa.

28 fevereiro 2025

Ciência e Engenharia dos Computadores

Diz-me quando procuras, dir-te-ei o que precisas. Colaboração INESC TEC-Amazon otimiza resultados dos motores de busca para datas comemorativas

A sazonalidade das pesquisas nos motores de busca pode ser um fator a considerar pelo comércio online para melhorar o posicionamento dos seus resultados. Um novo artigo-demo com assinatura INESC TEC partiu da criação de uma base de dados para apresentar a solução Occasion-aware Recommender, na tradução direta para português, um recomendador sensível ao contexto da ocasião.

26 fevereiro 2025

Ciência e Engenharia dos Computadores

INESC TEC desenvolve recursos de processamento de linguagem natural para a língua portuguesa

Expandir e construir novos recursos de processamento de linguagem natural (em inglês, Natural Language Processing - NLP) para a língua portuguesa foi o grande objetivo do projeto PTicola. Os resultados deste projeto, que incluem, por exemplo, um tradutor de inglês-português europeu e um identificador de variantes PT-BR/PT-PT, permitem responder à lacuna nos recursos de NLP disponíveis para o PT-PT, comparativamente ao PT-BR.

14 fevereiro 2025

004

Projetos Selecionados

PROD_AI

Solução IA/ML preditiva aplicada ao procurement e gestão de produção:

2025-2027

Doc2FraudDetection

Automated Detection of Fraudulent Documents

2025-2026

Easy4ALL

AI Assistant for No-Code Plataform

2024-2026

PTPumpup

Building Portuguese Language Resources through machine learning and limited human interaction

2021-2024

Equipa
Publicações

LIAAD Publicações

Ler todas as publicações

2025

Online boxplot derived outlier detection

Autores
Mazarei, A; Sousa, R; Mendes Moreira, J; Molchanov, S; Ferreira, HM;

Publicação
INTERNATIONAL JOURNAL OF DATA SCIENCE AND ANALYTICS

Abstract
Outlier detection is a widely used technique for identifying anomalous or exceptional events across various contexts. It has proven to be valuable in applications like fault detection, fraud detection, and real-time monitoring systems. Detecting outliers in real time is crucial in several industries, such as financial fraud detection and quality control in manufacturing processes. In the context of big data, the amount of data generated is enormous, and traditional batch mode methods are not practical since the entire dataset is not available. The limited computational resources further compound this issue. Boxplot is a widely used batch mode algorithm for outlier detection that involves several derivations. However, the lack of an incremental closed form for statistical calculations during boxplot construction poses considerable challenges for its application within the realm of big data. We propose an incremental/online version of the boxplot algorithm to address these challenges. Our proposed algorithm is based on an approximation approach that involves numerical integration of the histogram and calculation of the cumulative distribution function. This approach is independent of the dataset's distribution, making it effective for all types of distributions, whether skewed or not. To assess the efficacy of the proposed algorithm, we conducted tests using simulated datasets featuring varying degrees of skewness. Additionally, we applied the algorithm to a real-world dataset concerning software fault detection, which posed a considerable challenge. The experimental results underscored the robust performance of our proposed algorithm, highlighting its efficacy comparable to batch mode methods that access the entire dataset. Our online boxplot method, leveraging dataset distribution to define whiskers, consistently achieved exceptional outlier detection results. Notably, our algorithm demonstrated computational efficiency, maintaining constant memory usage with minimal hyperparameter tuning.

2025

KDBI special issue: Time-series pattern verification in CNC turning-A comparative study of one-class and binary classification

Autores
da Silva, JP; Nogueira, AR; Pinto, J; Curral, M; Alves, AC; Sousa, R;

Publicação
EXPERT SYSTEMS

Abstract
Integrating Industry 4.0 and Quality 4.0 optimises manufacturing through IoT and ML, improving processes and product quality. The primary challenge involves identifying patterns in computer numerical control (CNC) machining time-series data to boost manufacturing quality control. The proposed solution involves an experimental study comparing one-class and binary classification algorithms. This study aims to classify time-series data from CNC turning machines, offering insight into monitoring and adjusting tool wear to maintain product quality. The methodology entails extracting spectral features from time-series data to train both one-class and binary classification algorithms, assessing their effectiveness and computational efficiency. Although certain models consistently outperform others, determining the best performing is not possible, as a trade-off between classification and computational performance is observed, with gradient boosting standing out for effectively balancing both aspects. Thus, the choice between one-class and binary classification ultimately relies on dataset's features and task objectives.

2025

Preface

Autores
Campos, R; Jorge, M; Jatowt, A; Bhatia, S; Litvak, M;

Publicação
CEUR Workshop Proceedings

Abstract
[No abstract available]

2025

The 8th International Workshop on Narrative Extraction from Texts: Text2Story 2025

Autores
Campos, R; Jorge, A; Jatowt, A; Bhatia, S; Litvak, M;

Publicação
Advances in Information Retrieval - 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6-10, 2025, Proceedings, Part V

Abstract
For seven years, the Text2Story Workshop series has fostered a vibrant community dedicated to understanding narrative structure in text, resulting in significant contributions to the field and developing a shared understanding of the challenges in this domain. While traditional methods have yielded valuable insights, the advent of Transformers and LLMs have ignited a new wave of interest in narrative understanding. The previous iteration of the workshop also witnessed a surge in LLM-based approaches, demonstrating the community’s growing recognition of their potential. In this eighth edition we propose to go deeper into the role of LLMs in narrative understanding. While LLMs have revolutionized the field of NLP and are the go-to tools for any NLP task, the ability to capture, represent and analyze contextual nuances in longer texts is still an elusive goal, let alone the understanding of consistent fine-grained narrative structures in text. Consequently, this iteration of the workshop will explore the issues involved in using LLMs to unravel narrative structures, while also examining the characteristics of narratives generated by LLMs. By fostering dialogue on these emerging areas, we aim to continue the workshop's tradition of driving innovation in narrative understanding research. Text2Story encompasses sessions covering full research papers, work-in-progress, demos, resources, position and dissemination papers, along with one keynote talk. © The Author(s), under exclusive license to Springer Nature Switzerland AG 2025.

2025

Enhancing Portuguese Variety Identification with Cross-Domain Approaches

Autores
Sousa, HO; Almeida, R; Silvano, P; Cantante, I; Campos, R; Jorge, AM;

Publicação
AAAI-25, Sponsored by the Association for the Advancement of Artificial Intelligence, February 25 - March 4, 2025, Philadelphia, PA, USA

Abstract
Recent advances in natural language processing have raised expectations for generative models to produce coherent text across diverse language varieties. In the particular case of the Portuguese language, the predominance of Brazilian Portuguese corpora online introduces linguistic biases in these models, limiting their applicability outside of Brazil. To address this gap and promote the creation of European Portuguese resources, we developed a cross-domain language variety identifier (LVI) to discriminate between European and Brazilian Portuguese. Motivated by the findings of our literature review, we compiled the PtBrVarId corpus, a cross-domain LVI dataset, and study the effectiveness of transformer-based LVI classifiers for cross-domain scenarios. Although this research focuses on two Portuguese varieties, our contribution can be extended to other varieties and languages. We open source the code, corpus, and models to foster further research in this task. © 2025, Association for the Advancement of Artificial Intelligence (www.aaai.org). All rights reserved.

Factos & Números

14Artigos em conferências indexadas

2020

29Investigadores Séniores

2016

0Contratados de I&D

2020