Parallel Feature Selection Using Only Counts

Vinterbo, Staal; Que, Jialan

Vinterbo, Staal; Que, Jialan

Journal article, Peer reviewed

Published version

Åpne

Vinterbo (283.9Kb)

Permanent lenke

http://hdl.handle.net/11250/2594622

Utgivelsesdato

2018

Metadata

Vis full innførsel

Samlinger

Institutt for informasjonssikkerhet og kommunikasjonsteknologi [2525]
Publikasjoner fra CRIStin - NTNU [37304]

Sammendrag

Count queries belong to a class of summary statistics routinely used in basket analysis, inventory tracking, and study cohort finding. In this article, we demonstrate how it is possible to use simple count queries for parallelizing sequential data mining algorithms. Specifically,

we parallelize a published algorithm for finding minimum sets of discriminating features and demonstrate that the parallel speedup is close to the expected optimum.

Utgiver

Norsk informatikkonferanse

Tidsskrift

NIK: Norsk Informatikkonferanse