You can test this app and submit issues during the testing period of the Data Clustering Contest contest.

Entries with serious issues will not be able to win the contest, but even minor issues might be important for overall results.




Исправил ошибку вывода.
Исправил ошибку в категориях.

Fixed output error.
Fixed a bug in the categories.
Fair Leopard Feb 28, 2020 at 15:11
Final score for this submission (out of 100):

Languages: 13.29
News EN: 46.23
News RU: 53.2
Categories EN: 13.09
Categories RU: 13.12
Threads EN: 20.32
Threads RU: 13.26
Top news EN: 10.59
Top news RU: 10.59

These data reflect the relative accuracy, precision and speed of the algorithm as compared to the other submissions.
Fair Leopard Feb 6, 2020 at 16:03
In our preliminary tests, this submission received the following scores (out of 100):

Languages: 96
News EN: 75
News RU: 89
Categories EN: 1
Categories RU: 2
Threads EN: 59
Threads RU: 45
Top EN: 28
Top RU: 29

This is not the final result, please stay tuned for updates. We apologize for the delay.
Fair Quokka Feb 7, 2020 at 16:07
В ходе предварительного тестирования алгоритма были выявлены следующие недостатки в ранжировании:

– Категории 'Sport', 'Science' и 'Entertainment' пустые, в других единичное количество сюжетов. Небольшое количество сюжетов в целом. Некорректная обработка кавычек в заголовках.

– Отсутствуют главные сюжеты в категориях. Не указаны категории статей в разделе 'Main'. 

– Заголовки некоторых сюжетов не отражают их содержание. Нарушена сортировка статей в сюжетах: релевантные статьи смешаны с нерелевантными.
Fair Leopard Dec 12, 2019 at 14:53
We had to fix the following issues before running the algorithm and will apply relevant penalties during the final scoring:
- no tgnews binary in the root folder;
- invalid output format, fixed extra comma (",] => "])
Desert Falcon Dec 13, 2019 at 14:24
Нашел ошибку, почему категории не работают.

Обидная ошибка. В файле CategoryCalc.cs, в строке 25, вместо "Document doc = cell.Documents[i];" должно быть "Document doc =

Как раз делал эту строчку в последний день, и "наоптимизировал").

Found a mistake, why the category does not work.
Offensive mistake. In the CategoryCalc.cs file, on line 25, instead of "Document doc = cell.Documents [i];" should be "Document doc = cell.Documents [d];"
I just did this line on the last day, and "optimized").
Too strict thresholds during categories classification -> very poor categories
