Web Content Mining ist eine besondere Form des Data Mining. Dabei werden die Webseiten im Internet mit elektronischen Suchhilfen analysiert und nach bestimmten Kriterien abgesucht.
Da der Content einer Website aus multimedialen Datentypen wie Texten, Bildern, Fotos, Audios und Videos bestehen kann, die strukturiert, teilstrukturiert oder unstrukturiert sind, muss das Web Content Mining die Informationen auf den Webseiten filtern, kategorisieren und interpretieren. Das Web Content Mining geht daher weit über die gewöhnlichen Suchmaschinenergebnisse hinaus und ist z.B. für Wettbewerbsrecherchen oder wissenschaftliches Arbeiten sehr hilfreich.
Neben dem Web Content Mining gibt es noch das Web Usage Mining mit dem das Nutzungsverhalten von Websites untersucht wird.