 
                                 
                            Résumé: Cette communication examine l’impact de l’intégration de l’intelligence artificielle sur la santé mentale des employés, à partir d’une étude pilote menée auprès de professionnels concernés par des troubles psychiques. Les résultats suggèrent que l’IA peut réduire la charge cognitive et soutenir le bien-être, tout en présentant le risque de stress et anxiété liés à la dépendance aux outils d'IA générative.
Résumé: La faillite est un événement qui rythme la vie des affaires. Il est un sujet pluriel en ce sens qu’il mobilise plusieurs disciplines : le droit, la gestion et l’économie. Notre propos s’articulera en plusieurs temps. Dans un premier temps nous chercherons à définir le phénomène, à expliquer les causes et les conséquences en termes de coûts. Dans un deuxième temps, nous aborderons les modèles de prédiction de faillite, leurs évolutions, portées et limites.
Résumé: This survey proposes a theoretical and practical reflection on the use of machine learning methods in the context of the Internal Ratings Based (IRB) approach to banks' capital requirements. While machine learning is still rarely used in the regulatory domain (IRB, IFRS 9, stress tests), recent discussions initiated by the European Banking Authority suggest that this may change in the near future. While technically complex, this subject is crucial given growing concerns about the potential financial instability caused by the banks' use of opaque internal models. Conversely, for their proponents, machine learning models offer the prospect of better measurement of credit risk and enhancing financial inclusion. This survey yields several conclusions and recommendations regarding (i) the accuracy of risk parameter estimations, (ii) the level of regulatory capital, (iii) the trade-off between performance and interpretability, (iv) international banking competition, and (v) the governance and operational risks of machine learning models.
Résumé: Faisant partie intégrante des politiques publiques, pour encourager l’entrepreneuriat, le dispositif PÉPITE (Plan Étudiant pour l’Innovation, le Transfert et l’Entrepreneuriat) promeut la culture entrepreneuriale dans l’enseignement supérieur, notamment via le statut national étudiant-entrepreneur (SNEE), qui propose un accompagnement à la création d’entreprise. Les résultats disponibles montrent cependant que tous les PÉPITE sont loin de présenter des trajectoires et des résultats similaires. Afin de documenter cette hétérogénéité, cette recherche propose une analyse sémantique des documents produits par les PÉPITE depuis le concours jusqu’au reporting à l’aide du modèle SpaCy du traitement automatique du langage naturel. S’il met en évidence une forte homogénéité dans les contenus des différents rapports produits, il montre également que les différents PÉPITE sont largement alignés sur les attentes institutionnelles. Il conduit également à considérer qu’une prise en compte des spécificités locales et une plus grande flexibilité pourraient optimiser ce dispositif et encourager davantage de jeunes à entreprendre.
Résumé: To fit with the fast-growing number of autonomous agents and the need of an increased focus on end users, engineering complex multi-agent systems has to evolve towards more scalable and ethical systems, in respect of the users these systems are designed to serve, also in respect of the countries where these systems are deployed. Based on VOWELS modelling, we propose an iterative method of constructing such systems, which is divided into six stages, each of them being independently verified, the whole system being empirically validated. We model the end-users in terms of preferences, capabilities, activities and expectations, and the environment in which they operate. We install personal data protection mechanisms to ensure privacy of users. We explain how to determine, at design time, the right balance between legal aspects and moral aspects of the agents in the respect of a given country the multi-agent system is deployed. We show how the balance depends on the problem to solve, of the application domain, and how it should evolve over time. We illustrate our method on some practical applications we have developed in recent years : dynamic pricing worldwide, prediction of currency exchange with China, web site relooking in France. We believe the method of designing multi-agent systems we propose can increase their adoption and use in science and industry.
Résumé: Les IA générative (IAG) permettent de générer des textes, des images, des musiques et également de répondre à de nombreuses questions. Malheureusement, les modèles deviennent de plus en plus gros et nécessitent de plus en plus de données et de puissance de calcul. Ceci va à l'encontre des efforts énergétiques que notre société souhaite effectuer et pose des problèmes éthiques ou de vie privée. A travers cet exposé, nous ferons une présentation rapide du contexte et du vocabulaire et nous verrons certains de ces aspects plutôt contradictoires. Par la suite, nous présenterons des problématiques que l'IA amène sur l'enseignement avec des problèmes mais pas encore de solutions.
Résumé : Artificial intelligence (AI) has been seen as the next productivity frontier because of its high capability to transform almost all aspects of intra- and inter-organizational operations across industries. Yet very few empirical studies have been conducted to assess the actual value of AI. This talk will present insights from a bibliometric analysis of 40147 documents retrieved from the Web of Science database dealing with a "good AI society." Then, we will present and discuss some of the findings from our recent empirical studies, including one study that investigates the main benefits, challenges, and trends of ChatGPT and Generative AI (Gen-AI) in operations management. Finally, we will discuss potential research opportunities related to AI-enabled operations management.
Résumé : Handling large datasets and calculating complex statistics on huge datasets require important computing resources. Using subsampling methods to calculate statistics of interest on small samples is often used in practice to reduce computational complexity, for instance using the divide and conquer strategy. In this talk, we recall some results on subsampling distributions and derive a precise rate of convergence for these quantities and the corresponding quantiles. We also develop some standardisation techniques based on subsampling unstandardised statistics in the framework of large datasets. It is argued that using several subsampling distributions with different subsampling sizes brings a lot of information on the behaviour of statistical learning procedures: subsampling allows to estimate the rate of convergence of different algorithms, to estimate the variability of complex statistics, to estimate confidence intervals for out-of-sample errors and interpolate their values at larger scales. These results are illustrated on simulations, but also on two important datasets, frequently analysed in the statistical learning community, EMNIST (recognition of digits) and VeReMi (analysis of Network Vehicular Reference Misbehavior).
Résumé : Nous présentons deux projets de recherche longitudinaux (plus de3 ans) en miroir pour expliciter nos modèles et notre méthodologie. Les deux cas d'applications nous permettent de souligner les différneces et les points de convergence dans notre approche. Un zoom sera fait sur les biais et les conditions d'adoption des outils d'IA.
Résumé : Le développement des environnements pervasifs et des jumeaux numériques constituent un tournant important dans le processus de mutation de notre société. Dans le domaine particulier de la santé, ces environnements modèles numériques, permettraient de proposer des solutions crédibles aux nombreux défis auxquels notre société sera confrontée ces prochaines décennies : augmentation et vieillissement de la population, suivi des maladies chroniques, sédentarité croissante, obésité/diabète, etc.
Si les évolutions technologiques récentes permettent de donner corps à ces nouveaux environnements et au concept de jumeau numérique, il reste toutefois un certain nombre de défis scientifiques à résoudre pour rendre cette transformation crédible, efficace et acceptable par la société (traitement robuste des données, éthique, ergonomie et utilisabilité, etc.). Dans cette optique, j’ai adopté une démarche de recherche et d’innovation interdisciplinaire visant à élaborer des solutions de e-santé en partant des besoins des usagers (patients, médecins, etc.) et progressivement remonter aux composantes technologiques, puis à leurs intégrations et aux expérimentations terrains. Mes recherches m’ont ainsi amené à travailler sur des sujets divers mais extrêmement complémentaires tels que la modélisation par les approches de ML, les neurosciences ou encore l’interaction homme-machine.
L’objet de ce séminaire est de vous présenter cette démarche interdisciplinaire dans le cadre de trois applications médicales d’actualité : suivi et rééducation de patients post-AVC, éducation thérapeutique de patients diabétiques, accompagnement social de patients. À travers cette présentation, je mettrai en avant un certain nombre d’avancées scientifiques et technologiques par rapport à l’état de l’art, mais également des problématiques clés qu’il reste à étudier, tout en soulignant le rôle potentiel des jumeaux numériques dans l'amélioration de ces applications.
Résumé: CVs offer the opportunity to get massive data at the individual level that can be employed in economic or sociological studies.
However, these data often need to be pre-processed to be used in regression analysis as dependent or independent variables.
One common pre-processing step consists of classifying text into two or more categories.
In this study, we provide a general methodology for the classification of job experiences, using and comparing different methods such as regular expressions, machine learning, and deep learning techniques.
We illustrate it with a dataset of 10,000 job experiences from Computer Science CVs.
Résumé: Plongez dans l'univers fascinant du traitement automatique du langage naturel (NLP) en économie, où nous explorerons ses méthodes, ses défis et ses applications. De la définition du NLP à son fonctionnement interne, en passant par les techniques de vectorisation et les modèles de langue, ce séminaire offre une vue d'ensemble captivante de l'impact croissant du NLP dans le domaine économique.
Artificial Intelligence (AI) is becoming increasingly fundamental to various sectors within our society. However, most modern AI methodologies (e.g., Machine Learning and Deep Learning) are black boxes, which makes them difficult for users in many application fields. This challenge has led to the rise of a new field within AI called Explainable Artificial Intelligence (XAI). XAI aims to provide users with AI-based decision-making processes and outcomes that are easily understood, interpreted, and justified. Since 2018, there has been a significant and rapid increase in the number of research papers conducted on XAI. Among these domains, bankruptcy prediction stands out as a crucial area where XAI has begun to profoundly impact. By employing techniques such as feature importance analysis, local interpretable model-agnostic explanations (LIME), and SHapley Additive exPlanations (SHAP) values, researchers and practitioners can now uncover the rationale behind a model’s prediction that a particular firm is at risk of bankruptcy. This transparency enables banks, investors, and regulatory institutions to understand how specific factors, such as ratios and accounting variables, contribute to the model’s predictions. Moreover, XAI has opened new avenues in energy economics, especially in enhancing environmental quality. XAI models, such as the extremely randomized tree model combined with game theory-based SHAP analysis, adeptly handle nonlinear relationships among multidimensional predictors. This capability allows for accurate predictions while avoiding the restrictive assumptions about the distribution of residuals or the non-collinearity of covariates that traditional statistical models often demand in forecasting CO2 emissions.
Laboratoire de recherche interdisciplinaire réunissant sociologues, ingénieurs et designers, le médialab de Sciences Po mène des recherches thématiques et méthodologiques exploitant et interrogeant la place prise par le numérique dans nos sociétés. Par la multitude de données qu’il génère sous la forme de traces numériques, le web contribue à élargir les connaissances que nous avons des différents mondes sociaux. Pour alimenter ces travaux, l'équipe technique du médialab développe un écosystème de logiciels libres et de méthodes numériques visant la mise en œuvre simplifiée de toute une chaîne de traitement de la donnée, de la collecte à l'analyse, en passant par le nettoyage et la visualisation. Une présentation générale de ces outils et méthodes sera suivie d'un focus sur quelques cas concrets d'études appliquées à la circulation de l'information sur l'espace public et politique en ligne.
Coauteurs : Emanuele Campiglio (Universita di Bologna) et Davide Romelli (Trinity College Dublin)
Résumé : This paper studies the evolution and drivers of central bank communication on climate-related matters. We build a novel dataset containing 31,249 speeches from 131 central banks, over the 1986-2021 period. Using natural language processing techniques, we identify climate-related discourses and analyse their thematic content. We show how the rapid, but differentiated increase in climate-related communication can be linked to the rise of two distinct narratives, one centred around `green finance' as an opportunity, and the other around the threat represented by `climate-related risks'. We then study the drivers of those strands of climate communication and find that institutional dimensions - most prominently, the degree of involvement of central banks in financial supervision - are more significant in explaining climate-related communication than domestic exposure to physical and transition risks.
Résumé : Connue sous le nom de "ville des Sassi", Matera a fait l'objet d'un processus de rénovation impliquant toutes les régions de la Basilicate au cours des dernières années. Les ressources touristiques de la ville étaient pratiquement inconnues au niveau national et international, bien que les Sassi soient inscrits sur la liste du patrimoine mondial de l'UNESCO depuis 1993. La nomination de la Capitale européenne de la culture 2019 a déclenché une régénération intense, ouvrant la ville au tourisme mondial et révélant une grande résilience. Les expériences et les opinions des touristes ont été des ressources précieuses pour concevoir des activités touristiques et créer une nouvelle identité symbolique pour la ville, en particulier à l'ère du Web 2.0. Nous proposons ici de calculer les scores de polarité des avis et de les utiliser avec d'autres caractéristiques (par exemple, le prix, les services offerts et le type d'installations touristiques) pour créer des grappes spatiales selon la logique des indicateurs d'association spatiale locale (LISA). L'orientation sémantique géoréférencée des avis concernant une activité ou une attraction particulière représente une caractéristique quantitative utile pour des analyses ultérieures et la production de statistiques territoriales. La proposition peut être étendue à d'autres cas pour suivre l'évolution des sentiments à l'égard de domaines d'intérêt spécifiques et planifier d'éventuelles politiques d'intervention.
Résumé : Travaux appliqués du département recherche d’OpenStudio en IA et Économie : Conception d'outils de modélisation et de simulation des transformations des chaînes de valeur industrielles et d’accompagnement des entreprises pour aller vers des filières industrielles européennes plus autonomes, agiles et résilientes.
https://atlas.productive-synergies.com.
Résumé : Recently, Artificial Intelligence (AI) technology use has been rising in sports. For example, to reduce staff during the COVID-19 pandemic, major tennis tournaments replaced human line judges with Hawk-Eye Live technology. AI is now ready to move beyond such mundane tasks, however. A case in point and a perfect application ground is chess. To reduce the growing incidence of draws, many elite tournaments have resorted to fast chess tiebreakers. However, these tiebreakers are vulnerable to strategic manipulation, e.g., in the last game of the 2018 World Chess Championship, Carlsen—in a significantly advantageous position—offered a draw to Caruana (whom accepted the offer) to proceed to fast chess tiebreaks in which Carlsen had even better odds of winning the championship. By contrast, we prove that our AI-based method can serve as a judge to break ties without being vulnerable to such manipulation. It relies on measuring the difference between the evaluations of a player's actual move and the best move as deemed by a powerful chess engine. If there is a tie, the player with the higher quality measure wins the tiebreak. We generalize our method to all competitive sports and games in which AI's superiority is—or can be—established.
Abstract:
Around the world, countless workers perform data-driven tasks on online labour platforms to fuel the digital economy. Mostly brief, repetitive, and poorly paid, these so-called ‘micro-tasks’ include, for example, tagging objects in images, recording videos, and transcribing text, mostly for the artificial intelligence industry. Although these platforms have been harshly criticized for precarious working conditions and low wages, access to them is easy and open, even to unskilled people. In principle, women with care duties can be expected to benefit from flexible working hours and the possibility of working from home. However, this new form of online work fails to bridge the digital gender gap and may even exacerbate it. I demonstrate this result in three steps. First, inherited inequalities in the professional and domestic spheres turn platform-mediated micro-tasks into a ‘third shift’ on top of already burdened schedules. Second, the human capital of male and female data workers differs insofar as women are less likely to have received training in scientific and technological fields. Third, their social capital differs: using a ‘position generator’, a specific tool to capture workers' access to information and support resources that can come from their contacts with people in different occupations, I show that women have fewer ties to digital-related professionals who could provide them with knowledge and advice on how to successfully navigate the world of platforms. Taken together, these factors leave women with fewer career prospects in a technology-driven workforce and reproduce their relegation to lower-level computer jobs already observed in the early history of 20th century technology.
Rapporteur : Bastien Lextrait
Résumé : The ability to identify early-stage venture potential, which has traditionally relied on experts, is challenging because new ideas are uncertain. However, judgment from a large number of evaluators can effectively identify promising ventures. This paper empirically studies whether crowd-based information generates informative feedback for entrepreneurs and seed investors. Using data on 701 early-stage founders of new ventures examined by 2,600 evaluators, I estimated the effects of crowd-based ratings on survival and securing seed funds. I find that the crowd rating was uncorrelated with subsequent financing events from seed investors but increased a venture’s probability of continuation by 3.1 percentage points. This effect became stronger as the number of evaluators increased. This finding highlights that a judgment aggregation offers information for nascent venture founders.
Rapporteur : Mathieu Bernard
Résumé : Il peut arriver qu'un territoire soit sous l'emprise d'un pouvoir illégitime, contre lequel une partie de la population souhaite résister. De même, une population peut vouloir attirer l'attention d'un gouvernement sourd à ses revendications. Un des principaux moyens est alors la perturbation des infrastructures installées sur le territoire, typiquement les transports (routiers, aériens, maritimes), l'approvisionnement en ressources (énergie, eau), ou les communications (internet, médias). La plupart de ces infrastructures reposent sur des réseaux ; il s'agit donc d'y trouver des points faibles, de les bloquer ou de les saturer. Pour ce faire, plusieurs stratégies sont envisageables. Elles posent des questions de recherche en informatique que je propose de discuter dans cet exposé.
Rapporteure : Nadine Levratto
 Please wait ...
                        Please wait ...