Согласно устоявшемуся мнению, слово можно охарактеризовать как совокупность букв, находящуюся между двумя пробелами. Но если взять, к примеру, язык гренландских эскимосов, то в нем одним словом считается целое предложение. Есть проблемы и в менее экзотических языках. К примеру, чешский язык предполагает слитное написание частицы «не» с глаголами, в турецком языке данное отрицание находится в центре слова. Таким образом, по нашим правилам получается, что каждое слово с находящимся в нем отрицанием стоит считать отдельно.

Возникает вопрос: как быть со словами, имеющими различные окончания (к примеру, «красивый», «красивая», «красивое»), а также омонимами - например, замок как строение и замок как устройство? Можно ли засчитать как отдельные слова аббревиатуры – КВН, КГБ, ОВД и т.п.? В каждом языке существует десятки тысяч подобных подвохов.

Еще более каверзными являются вопросы, касающиеся того, что именно считать языком. Могут ли различные говоры и диалекты относиться к отдельным языкам или это разновидности основного? Например, в Африке и Европе часто случается так, что невозможно сразу определить, какой язык для отдельно взятого диалекта является основным. Да и можно ли однозначно утверждать, к какому из языков относятся некоторые слова? К примеру, «атаман» или «хата» – это украинские или все же русские слова? К какому языку можно отнести слова «сайт», «сервер», «провайдер» – русскому, английскому, немецкому или всем сразу?

Поэтому стоит ограничиться лишь общими подсчетами, не претендующими на научность. Что касается русского языка, то в нем, по мнению лингвистов, содержится около 500000 слов. Это число приблизительное и не включает в себя специальных научных терминов. Зато здесь имеются устаревшие, заимствованные из других языков, сложные слова, ласкательные, уменьшительные формы и другие. Если обратиться к авторитетному Большому академическому словарю, состоящему из семнадцати томов, то в нем окажется 131 257 слов. Однако следует учитывать, что годом его издания является 1970, а русский язык за последние 40 лет претерпел множество изменений и значительно обогатился такими понятиями, как, например, «перестройка», «интернет» и т.д.

Что касается английского языка, по данным мониторинга Global Language Monitor, в 2009 году число слов превысило в нем цифру в один миллион и продолжает увеличиваться. Причем миллионным словом стало «Web 2.0». По данным авторитетных словарей, английский язык также опережает русский. Например, в 3-ем издании Вебстеровского словаря содержится 450000 слов, в Оксфордском – примерно 500000.

Особый интерес представляют иероглифические языки, в которых отдельным символом обозначается не буква, а целое слово. В этом случае прямые сравнения вовсе невозможны. Однако если провести сравнение по словарям, такие языки, к всеобщему удивлению, сильно проигрывают. Например, в наиболее полном японском словаре содержится 50000 иероглифов. Но Министерство просвещения Японии утвердило для повседневного использования лишь 1850 иероглифов. Китайский язык содержит около 80 тысяч иероглифов. Но реально здесь также используется намного меньше. Утвержденный в 1981 году госстандарт «Основной набор иероглифов» включает 6763 иероглифа.

В количественные лидеры неожиданным образом попадает итальянский язык. В нем все составные числительные пишутся прописью слитно, в одно слово. Числовой ряд, как известно бесконечен, поэтому получается бесконечным и количество слов итальянского языка.