Text Mining for Merck Pharma Regulatory Intelligence
Praxis
Zusammenfassung
Automatisierung der Umwandlung unstrukturierter Daten mit Behördlicher und Identification-of-Medicinal-Products(IDMP)-Relevanz
In der Pharmaindustrie liegen große Mengen an Unternehmensdaten in unstrukturierten Textformaten vor. Sie enthalten wertvolle Informationen, die von der frühen Wirkstoffentdeckung bis zur Post-Market-Analyse eine Schlüsselrolle spielen. Die Tatsache, dass diese Daten in unstrukturierter Form vorliegen, erschwert es klassischen Informationssystemen, verborgene Informationen effizient zu suchen, zu finden und zu extrahieren. Text Mining verwendet linguistische und statistische Verfahren, um den Aufbau von intelligenten Systemen, welche die automatisierte Extraktion von Informationen und Erkenntnissen aus Textdaten steuern können, zu ermöglichen. In diesem Beitrag beleuchten wir die Anwendung von Text Mining mit Betonung darauf, wie es einen Mehrwert für regulatorische Prozesse schaffen kann, die im Vergleich zu anderen Prozessen in der Medikamentenentwicklung hauptsächlich dokumenten- oder inhaltsgesteuert sind.
Abstract
Large volumes of enterprise data in pharmaceutical industries are present in unstructured text formats. They contain immense valuable information which play a key role in influencing from early discovery to post-market analyses. The intrinsic nature of data being unstructured makes it difficult for classical information systems to efficiently search, find and extract hidden pieces of information. Therefore, text mining which leverages natural language