Поиск тенденций в загрузке текстовых данных

У меня есть большой стол и хотелось бы, по крайней мере, найти самые повторяющиеся работы, чтобы у меня был список ключевых слов трендов.

База данных – это mysql, и я запускаю php5.

Есть ли другой способ помимо взрыва данных и поиска повторений на стороне php?

Как насчет наличия комбинаций из 2/3 слов ключевых слов?

Есть предположения?

ну … как я не получил никаких ответов, я нашел способ, использующий php:

$wordfrequency = array_count_values( str_word_count( $string, 1) ); 

надеюсь, что это поможет кому-то 🙂

Похоже, вы почти говорите о реализации алгоритма цепи Маркова . Однако, без полной обработки данных, я не могу думать о том, каким образом вы могли бы использовать только SQL для такого рода трендов.