Text- en datamining

Onder text- en datamining (hierna TDM) wordt verstaan het geautomatiseerd doorzoeken van tekst en databanken om (nieuwe) patronen, trends en verbanden te ontdekken. De technieken uit TDM worden in toenemende mate toegepast op wetenschappelijke literatuur, zoals bijvoorbeeld tijdschriftartikelen of monografieën. TDM kan worden toegepast binnen alle stadia van het onderzoeksproces.

TDM  is bijvoorbeeld:

  • information retrieval: er is een groeiend aantal uitgevers dat textmining expliciet toestaat in hun licentievoorwaarden. Al mogen uitgevers TDM niet contractueel uitsluiten, zij kunnen wel voorwaarden stellen hieraan en aan de manieren waarop textmining kan worden uitgevoerd. Deze kunnen per uitgever verschillen, bijvoorbeeld alleen textmining toestaan met de tools die ze zelf aanbieden.
  • information extraction: het identificeren van zaken als persoonsnamen, organisaties of onderwerpen binnen teksten en het vaststellen van relaties
  • datamining: het vaststellen van correlaties, regelmatigheden of andere patronen binnen teksten

 

Auteursrechten en Text- en dataming
 

Text- en datamining technieken kunnen worden toegepast op bronnen die zich in het publieke domein bevinden en op auteursrechtelijk beschermd materiaal.

Binnen projecten die gebruik maken van TDM worden er over het algemeen lokale kopieën van teksten gemaakt. Het maken van kopieën is normaal gesproken voorbehouden aan de auteursrechthebbende. Voor universiteiten (en andere niet-commerciële onderzoeksinstellingen) is het maken van kopieën ten behoeve van TDM echter toch toegestaan volgens artikel 15n en 15o van de Auteurswet (geldend sinds 7 juni 2021).

TDM is voor onderzoekers mogelijk bij alle werken waar zij rechtmatige toegang tot hebben. Bijvoorbeeld materiaal dat vrij toegankelijk is via het internet of via toegang van de catalogus van de organisatie.

Uitgevers mogen TDM niet contractueel uitsluiten. Zij mogen niet in de licentie met de universiteit opnemen dat TDM niet toegestaan is. Ook mogen uitgevers geen technische barrières aanbrengen die TDM onmogelijk maken.

Er is een groeiend aantal uitgevers dat textmining expliciet toestaat in hun licentievoorwaarden. Al mogen uitgevers TDM niet contractueel uitsluiten, zij kunnen wel voorwaarden stellen hieraan en aan de manieren waarop textmining kan worden uitgevoerd. Deze kunnen per uitgever verschillen, bijvoorbeeld alleen textmining toestaan met de tools die ze zelf aanbieden.
 

Vragen?
 

Heb je naar aanleiding van deze vuistregels nog vragen? Neem dan contact op met een van de medewerkers van het Auteursrechten informatiepunt (AIP) van je instelling. 

 

 

Download deze vuistregels in PDF
Vuistregels tekst en datamining
Downloaden Nederlands, Bestandsextensie: PDF (Bestandsgrootte: 128 KB)
Download this quick reference guide in PDF
QQuick reference guide on text and datamining
Downloaden Nederlands, Bestandsextensie: PDF (Bestandsgrootte: 104 KB)