A DSTK - Data Science Toolkit 3 egy adat- és szövegbányászati szoftvercsomag, amely a CRISP DM modellt követi. A DSTK statisztikai és szöveges elemzéssel, az adatok előkészítésével a normalizálás és a szövegfeldolgozás, a gépi tanulás és a statisztikai tanulási algoritmusok modellezése és értékelése révén nyújt adatokat.
A DSTK 3 olyan vonzó tulajdonságokat kínál, mint a Deep Neural Network (Deep Neural Network), a szöveges link elemzés a vizualizációkkal, a KMeans fürtözéssel. Néhány ilyen tulajdonság régebbi verzióban jeleníthető meg, de mivel az algoritmusokat újraírják, hogy csökkentse a külső könyvtárak használatát, mint például a Weka, hogy csökkentse a fájlméretet, több időre van szükségük ezek fejlesztéséhez. A DSTK motor még mindig béta állapotban van, ezért lehetnek hibák és pontatlanságok.
A DSTK 3 a DSTK Engine, a DSTK ScriptWriter, a DSTK Studio és a DSTK Text Explorer. A DSTK Motor R egyszerűsödik, a Data Miningre összpontosítva. A DSTK ScriptWriter grafikus felületet kínál a DSTK Engine parancsfájl írásához. A DSTK Studio olyan statisztikai adatokat kínál, mint az adatbányászat GUI-ja, és a DSTK Text Explorer GUI-t kínál a szövegbányászat számára.
Követelmények :
Java Runtime Environment, Microsoft. Net Framework
Korlátozások :
10 felhasználású próbaverzió
Hozzászólás nem található