2010
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
Математика. Механика. Информатика Вып. 2(2)
УДК 511.2
Возможности вычислительных методов в проблемах теории чисел
Е. Л. Тарунин
Пермский государственный университет, Россия, 614990, Пермь, ул. Букирева, 15 [email protected]; (342) 2-237-10-31
Показано применение персональных компьютеров к решению двух проблем: выявлению закономерности распределения простых чисел и подтверждению гипотезы Эйлера-Г ольдбаха.
Ключевые слова: теория простых чисел; численные методы; распределение простых чисел; проблема Гольбаха.
В теории чисел применяются тонкие аналитические методы [1-3]. Несмотря на малость практических приложений, выдающиеся математики называют эту теорию "жемчужиной математики". Со второй половины XX в. для изучения теории чисел стали применять вычислительную технику. И все же возможности вычислительной техники в этой области используются недостаточно. Перечисление 18 задач теории, которые еще ждут своего решения, содержится в последней главе книги [2].
С помощью ПК удалось подкорректировать коэффициенты в оценках распределения простых чисел и найти новые закономерности. Что касается бинарной гипотезы Гольдбаха (любое четное число может быть представлено суммой двух простых чисел), то следует отметить, что новым результатом в этой области будет доказательство выполнимости гипотезы для чисел более 1010. Такая проверка потребует значительных усилий от опытного программиста. Но игра стоит свеч. За решение проблемы обещан миллион долларов. Правда, в Интернете есть непроверенная информация о том, что условие о награде отменено в 2002 г. Кроме того, там же сказано, что будто бы минский математик доказал гипотезу, но пока его доказательство не проверено. Но даже если премии нет, решение этой проблемы (ей более 3 столетий) даст большое моральное удовлетворение и славу.
© Е. Л. Тарунин, 2010
Достаточно вспомнить, что теорией чисел занимались такие математики, как Ферми, Гаусс, Эйлер, Лагранж, Риман, Дирихле, Чебышев, Виноградов и другие. Отметим, что И.М.Виноградов работал в Пермском университете в 1918-1920 гг. вначале доцентом, а затем профессором.
В Интернете есть предупреждение для тех, кто думает, что проблему можно просто решить. Это предупреждение звучит так "Не пытайтесь решать великие проблемы, не поняв теории, которые их окружают. Сэкономьте нервы и себе, и окружающим". Невозможно не согласиться с этим предупреждением. И все же мы полагаем, что у прикладников больше возможностей подступиться к штурму проблем теории чисел, несмотря на то, что им (в отличие от математиков) теорию чисел не излагают. Для ознакомления с теорией чисел существует много учебников [1-5].
В статье содержится 8 разделов. В первых трех разделах приводятся в основном сведения из теории простых чисел, которые будут анализироваться в следующих разделах.
1. Распределение простых чисел
Существование бесконечного множества простых чисел доказывается просто. Однако вопрос о том, как часто среди натуральных чисел встречаются простые и как простые числа распределены среди натуральных, оказывается весьма сложным. Отметим, что в
данной статье мы касаемся лишь элементарных методов исследования. Так называются [6] все методы, которые не опираются на применение принципа Римана о нулях дзета-функции или на положения теории функций комплексных переменных.
Число простых чисел, меньших или равных х, как это принято, будем обозначать функцией к(х)- Этой функции приписывают
гладкость, что не соответствует действительности. Для того чтобы подчеркнуть целочисленные свойства соответствующей функции, в нашей работе будем использовать следующие обозначения: / - номер простого числа, а УЩ - значение этого числа. При этом будем считать, что первое простое число равно двум, т.е. У(1)=2, У(2)=3, У(3)=5 и т.д. Функции распределения тг(х) при этом соответствует
ступенчатая функция /(Ж). Производная этой ступенчатой функции изменяется в широких
пределах: от 1/2 на близнецах до 1/ ^ ^ -
максимальное расстояние между соседними простыми числами).
Поиск формул, порождающих простые числа, предпринимал еще Ферма (1601-1665). Он высказал предположение, что все числа
2й
вида 2 +1 (п — натуральное число) являются простыми [1]. Его предположение оказалось неверным. В 1732 г. Эйлер показал, что при п=5 число является составным. В 1875 г. И.М.Первушин обнаружил, что при п=12 и п=23 также получаются составные числа. В 1837 г. Лежен-Дирихле доказал, что среди членов арифметической прогрессии вида а-х + Ь с взаимно простыми числами а, Ь имеется бесконечное множество простых чисел [1]. Доказывается теорема, что в качестве формулы, порождающей все простые числа, не может быть полином с целыми коэффициентами.
Оценку роста функции распределения получали и уточняли многие ученые. Коснемся лишь тех оценок, которые будут проанализированы. К простейшим оценкам относятся неравенства [5]
ж Л >1пк — 1, <е,+1, рм <2рг
Первое неравенство является одним из доказательств бесконечности простых чисел. Последнее неравенство вытекает как следствие гипотезы Бертрана о существовании простого числа на интервале к, 2х . Справедливость этой гипотезы доказал Чебышев. Рас-
ширением гипотезы Бертрана является гипотеза о существовании определенного числа простых чисел на интервале (X, Ях) при
Я У 2.
В 1808 г. Лежандр опубликовал эмпирическую формулу [1, 2], предложенную для больших значений х (от 104 до 106):
Ж # « /г # = ------------. (1)
" 1п *^1.08366
Позднее Чебышевым было указано, что более близкое значение к реальному распределению простых чисел дают функции
/,х
In 4 — 1 ’
(2)
Fg Х.
• dx In і
-= li к -li £ .
(3)
Обрабатывая имеющиеся таблицы, Гаусс еще в юношеские годы нашел, что функция (3) хорошо аппроксимирует зависимость ж(х), но опубликовал этот результатов значительно позднее. Функция П в (3) называется интегральным логарифмом
0
ds In й
ds
\
Так как li £___~ 1.04 [5] и в теории интересуются большими значениями х, то обычно не делают различия между интегральным логарифмом и Fa Щ , при этом функцию Fa И
также называют интегральным логарифмом.
В 1848-50 гг. были опубликованы работы П.J1.Чебышева, касающиеся роста функции я(х) . Чебышев доказал, что при достаточно больших х справедливы неравенства
a-f *^ж * J,A-f *^
In * __
Для множителей в этих оценках он предложил значения а = 0.92129, А = 1.0555 [5]. В [14] указаны более грубые значения для коэффициентов a — Ini. / 2~ 0.347,
А < 2hi £ ~ 1.386. полученные Чебышевым, видимо, в предварительных оценках. Доказательство П.Л.Чебышева о существовании коэффициентов a, A, обеспечивающих выполнение неравенств (4), содержится, например, в [2]. Значения множителей позднее уточнялись. Уточняются они и в нашей работе. Из
X
2
x
теоремы Чебышева, в частности, следует, что при увеличении х отношение ж к _[х —» 0 . Чебышевым было высказано утверждение о существовании асимптотической формулы при х —> со
ж к = Ііт-
(5)
Считается, что Чебышевым был решен вопрос о существовании простой функции, предложенной еще Гауссом, которая служит наилучшим приближением для ж к
ds
1п # 1п к 1п к
к- 1 ]х 1пк к
Существование предела (5) или, точнее, его следствия при х —> со дает утверждение
НшГ2 = Нш
ж к ■ 1п к
X
1.
которое было доказано в 1896 г. независимо друг от друга Адамаром и Вале-Пуссеном. Представление о скорости приближения О к единице дают полученные значения для номеров / = 15001 и /=30001: 1.0992 и 1.09314 соответственно. К сожалению, вычислить значение О. для известного большого простого числа, например
/> = 1 + 180 £ -1 [1], невозможно, так как
неизвестен его номер.
Доказательства Адамара и Вале-Пуссена были основаны на рассмотрении дзета-функции Римана. Идея такого подхода к проблеме распределения простых чисел была дана Б. Риманом в 1859 г. Работы этих авторов показали, что функция (3), предложенная Гауссом, дает более точное приближение к Ж к , чем функция
/*~=—^ (7)
' 1п к
Отличие функции (3) от функции (7) х х
-= // к - / к . (8)
1п * 1п к
анализировалось многими математиками. Последователями И.М. Виноградова методом тригонометрических сумм получены оценки модуля Ахж к . содержащие функции с параметрами. Для существующих таблиц простых чисел обычно величина Ахж к положительна. Этот факт следует из разложения
(3). Из него следует, что относительная ошибка вычисления ж к
1
1п к
(9)
становится менее 5% при х > 109.
В 1914 г. Литллвуд доказал, что величина Ахж Л принимает бесконечно много значений, как положительных, так и отрицательных. Анализ этой величины на РС (см. ниже) вызывает сомнение в правильности утверждения Литллвуда.
Кроме неравенств Чебышева (4) в теории чисел предлагались следующие неравенства:
X — X
<жк <--------. (10)
1п к + 2
1п к -4
При решении проблемы распределения простых чисел часто выясняют, на каком интервале от X до к + А _ существует хотя бы одно простое число. В качестве А рассмат-
А 0
ривались, например, значения А = X с параметром в. Для этого параметра была получена оценка О = 48/77 + є» 0.6237+ є, а позднее: 9 = 38/61+ є к, 0.6230+ є . Существует недоказанное предположение Лежандра [5] о том, что в = 0.5 (А = л/х ). Ответы на указанные вопросы могут быть получены с помощью анализа большой таблицы простых чисел на вычислительной машине.
В качестве примера рассмотрим вопрос
о справедливости предположения Дебова
(БезЬоуев) [1, с.20]: на интервале от п2 до - 1 т
я +1 находится не менее двух простых чисел. Имея таблицу простых чисел, легко убедиться в справедливости предположения и, кроме того, выяснить, как часто появляется число простых чисел 2 и более, находящихся на указанном интервале. При числе простых чисел /т = 30001 максимально возможное для проверки значение /7 = 588
Программа выяснила, что два простых числа находятся лишь на двух интервалах с п = 3, 4 . Далее встречаются числа 3,4,5 с постепенным (не монотонным, как обычно) увеличением числа простых чисел. Расширение интервала, равного 2п +1, и увеличение простых чисел на них не оставляют сомнений в справедливости предположения. В этих вы-
X
X
X
2
числительных экспериментах обнаружился любопытный факт - чаще всего (14 раз, что составляет 2.37% от общего числа рассмотренных интервалов) на интервалах Дебова размещается 74 простых числа. То есть интервалы с меньшим числом простых чисел встречались реже. Например, меньшее число простых чисел равное двум, встретилось лишь три раза при п =2, 3, 5. Максимальное число простых чисел на интервалах Дебова при п < 590 равнялось 98.
2. Разность между простыми числами
Существует много вопросов, касающихся разности между простыми числами [3]. Среди них выделяются вопросы поведения di = N &+\ - N Й - разности между соседними простыми числами; количество и распределение близнецов, для которых б/( = 2, или, более общо, пар с разностью равной 2к к = 1, 2, 3,... . С помощью гипотезы Ри-мана доказано, что
dj <(рх I = (11)
Эвристические рассуждения показывают, что, вероятно, справедлива оценка
с11.< ф2 й~= 1п2 N (12)
Согласно [3, 6] лучшей к 1983 г. являлась оценка, полученная M.N.Huxley (1973) по методу большого решета:
d.<(p^Л=N/3A, В = ——ь е.
^ 12
Вычислительные эксперименты дают поправочные коэффициенты к функциям (11)-(13) и позволяют расставить соответствующие функции в следующем порядке (при достаточно больших N):
Фу( О >- <^з(0 >- <р2( о, из которого следует, что лучшей является оценка (12), а не (13).
3. Проблема Г ольдбаха
В 1742 г. прусский математик Кристиан Гольдбах в письме Л. Эйлеру высказал предположение! "Каждое нечетное число больше 5 можно представить в виде суммы трех простых чисел". По этому поводу Эйлер выдвинул более сильную гипотезу "Каждое четное число больше двух можно представить в виде суммы двух простых чисел". Первое утвер-
ждение называют тернарной проблемой Гольдбаха, а второе - бинарной проблемой Гольдбаха или Гольдбаха-Эйлера. Из справедливости бинарной проблемы автоматически следует справедливость тернарной проблемы. Действительно, если четное число есть сумма двух простых чисел (т=р1+р2), то, добавляя к каждому четному числу 3, можно получить все нечетные числа, равные сумме трех простых чисел (т+3=р1+р2+3).
Коротко осветим историю вопроса. В 1923 г. Харди и Литлвуд показали, что из справедливости обобщенной гипотезы Римана [3] следует справедливость гипотезы Гольдбаха для всех достаточно больших значений нечетных чисел Ш > 11% . В 1937 г. Виноградов, не используя гипотезу Римана, а используя метод тригонометрических сумм, доказал
существование т*. Последователь Виноградова дал оценку для Ш:,, содержащую 6 млн
цифр. В 1989 г. Ванг и Чен опустили нижнюю грань до числа, содержащего 43 тысячи цифр. В 1997 г. четверо ученых показали, что справедливость гипотезы Римана обусловливает справедливость тернарной проблемы Гольдбаха для т >т„ ~ 1 О2", Если предыдущие оценки практически не позволяли убедиться в справедливости гипотезы до указанных значений 111. , то последняя оценка дает такую
надежду при использовании современной вычислительной техники. Как следует из сказанного, последняя оценка получена из предположения справедливости гипотезы Римана, которая не доказана. Мы не будем останавливаться на обсуждении этой гипотезы, сформулированной в 1859 г. Подтвердим лишь ее сложность и значимость историческими фактами. Однажды Гильберта спросили, чем бы он поинтересовался в первую очередь, если бы проспал 500 лет. Гильберт сказал "Я бы спросил "Доказана ли гипотеза Римана?" Гипотеза входит в список 7 проблем тысячелетия, за решение каждой из которых Математический институт Кембриджа обещал приз в 1 млн долларов США.
Обещанный миллион многим не дает покоя. Поэтому не случайно в Интернете можно найти объявления о якобы доказательстве гипотезы Римана. Так в Интернете (Ком-пьюлента, 11 июня 2004 г.) помещена заметка
В.Парамонова с интригующим заголовком "Найдено доказательство гипотезы Римана".
Профессор математики из университета Пердью Луи де Бранж де Бурсил утверждает, что нашел доказательство гипотезы Pимана. Его изыскания на 23 листах выложены в свободном доступе [12] и ждут опровержения.
Бинарная проблема Гольдбаха далека от решения. Есть работы [1], в которых доказывается, что если есть доля чисел, не представимых в сумме двух простых, то она мала. Есть работы, в которых увеличено число слагаемых до б и более. Утверждается, что на июль 2008 г. бинарная проблема проверена до п< 1.2-1018 [8], а на сайте "Элементы: Проблема Гольдбаха" указано значительно меньшее значение т < 10000Q.
В сентябре 2004 г. журналистка Татьяна Нечапайко разместила в Интернете заметку о том, что якобы 75-летний минский математик, кандидат наук Виктор Карпов решил "задачу" Гольдбаха-Эйлера [8]. Карпов отнес свою работу в Белорусский государственный университет, педагогический университет и АН. По его словам, от него "отмахиваются, как от назойливой мухи". В заметке описана запутанная история с обещанием в 2000 г. выплатить 1 млн долларов за решение проблемы (по непроверенным сведениям обещание действовало лишь до 2002 г.). Там же отмечено, что греческий ученый и писатель Апостолос Док-сиядис проблему не решил, но, написав роман об этой проблеме [9], приобрел всемирную славу. После того как книга стала бестселлером, английское издательство "Faber and Faber" и американское "Bloomsbery" и пообещали приз за решение проблемы. Журналисты "Комсомольской правды в Беларуси" пытаются выяснить судьбу обещанного миллиона и ждут подтверждения правильности доказательства В.Карпова.
4. Вычисление таблицы простых чисел
Наиболее древним способом получения простых чисел является использование алгоритма Эратосфена. Pабота с алгоритмом на вычислительных машинах требует первоначального массива гораздо большего размера, чем размер окончательного массива N і , поэтому вызывает определенные трудности.
В использованном алгоритме после задания первых четырех простых чисел следующие числа вычислялись по программе (Paskal):
for i:=4 to im do begin j:=2;
10: nc:=N[i]+j; {candidate for next number}
for i 1:=2 to im do begin if N[i1] > 0.5*nc then goto 12;
if nc mod N[i1] =0 then begin j:=j+2; goto 10; end; end;
12: N[i+1]:=nc; end; {for i} Использованный алгоритм на ПК Toshiba требует около 4 сек для получения 30 тысяч простых чисел при программе в Delphi. Одна и та же программа на Паскале в Delphi работает примерно в 2.5 раза быстрее. Для выявления зависимости времени счета от последнего номера простого числа im может быть использована формула:
t ж 5 • 10 9 • im2 сек. (14)
Из нее, в частности, следует, что для получения 1 млн простых чисел требуется около 1.5 часа счета.
Отметим особенности программы. Целые переменные и массив для целых чисел предназначены для хранения longint. Первый кандидат на простое число получается добавлением к предыдущему числу j=2. Если полученное число делится на младшие предыдущие простые числа, добавка к новому кандидату на испытание увеличивается еще на 2 оператором j:=j+2. Процесс проверки повторяется до тех пор, пока не выяснятся, что нет делителей у числа nc. И если делителей нет, происходит запись нового простого числа N[i+1]:=nc. Оператор в третьей строке служит для сокращения излишних проверок. Если его убрать, время счета увеличивается примерно вдвое.
Выяснено, что простое число становится более чем в 10 раз больше своего номера при і > 6473, так как
N 6472 ”= 64717, N 6473 = 64747~. Среди последних цифр простых чисел (1, 3, 7, 9) нет выделенных, их доли при А/ > 200 составляют ~ (25 + 1)%.
5. Анализ аппроксимаций распределения простых чисел
Опишем вначале отличие функций Fg ( х) f ( Х) , описанных в (3) и (4) соответственно. Определенный интеграл в функции Гаусса вычислялся по трем приближенным формулам прямоугольников:
v>f- 1
__ N г'І=! s*'= £
і
к=2
In it+ 0.5
k=2 In к +1 __ _
__ N г'І=! *:= s
к=2
In к
1
В силу монотонного убывания подынтегральной функции для этих сумм выполняются неравенства ^ < 5 < ^2 .
Уже при N=1000 относительная погрешность интегралов менее 0.08% и с ростом N она убывает. Приближенные значения интегралов с избытком и недостатком удобно использовать для получения гарантированных оценок сверху и снизу.
Таблица 1_________________
Согласно теории значения рассматриваемых функций при х —> со должны сближаться, а их отношения к номеру простого числа стремиться к 1. При конечных х обычно уверенно выполняется неравенство Ра # > /*_• Представление о поведении этих функций дает табл. 1. Напомним, что номер простого числа обозначаем буквой І, а соответствующее значение простого числа - буквой N і .
і 1000 4000 10000 20000 30000
7919 37813 104729 224737 350377
т С* 1.0163 1.00625 1.0038 6 1.00259 1.001837
/ N і ^і 0.8821 0.89686 0.9069 3 0.91188 0.91482
Как видно, функция Ра Ш дает завышенные значения номера простого числа, а функции / IV - заниженные. Их сближение происходит медленно. Относительное превышение Ра §1 над номером простого числа может быть охарактеризовано также отношением Л Л =100• £0_/г—1_.
Эта величина с ростом номера числа в целом монотонно убывает (нарушения монотонности характерны для значений А/ < 100). При / = 1000 Л «1.63%, Л становится меньше 1% при />2100, а при />15000 Л < 0.33%.
Указанные зависимости характерны и для бо'льших номеров простых чисел. В [4] приведена теорема Е.Мейсселя, позволяющая вычислять я к далеко за пределам обычных таблиц простых чисел, и в качестве примера приведено значение я ЯО9 =/ = 50847478. Аргумент X в этом примере может отличаться от соответствующего значения N на расстояние между простыми числами, но при достаточно больших X это слабо сказывается на точности оценок. Использование этого примера позволяет оценить коэффициенты табл.1, указанные в третье и четвертой строках: 1.000035, 0.94901 соответственно.
Заметим, что вычисление определенного интеграла в формуле Гаусса при > 109 требует немалых затрат машинного времени
(при = 109 около 10 мин). Для сокращения затрат можно использовать идеи распараллеливания алгоритма.
Перейдем к нахождению коэффициентов а,А, которые удовлетворяют неравенствам Чебышева (4) на реальных таблицах N і .
В этом случае алгоритм заключался в циклическом переборе всех табличных значений и нахождении коэффициентов, которые удовлетворяют неравенствам( 10 < / < іт +1): а-N і\7іп N /|_</ <А-Иі\7іп N/|^ (15) Перед началом проверки задавались значения коэффициентов, которые заведомо изменятся, и отслеживался номер простого числа, при котором произошла последняя корректировка. При іт = 30000 оба коэффициента оказались бо'лыпими единицы: а = 1.0926 і = 26963~ А = 1.25506 = 307. В скобках указан номер последней корректировки. Заметим, что если цикл проверки начать с / = 31, то величина А уменьшится до А=1.22358 (/ =46). Значение а > 1 подтверждает факт заниженной величины / (х) при
малых и умеренных значениях х . Для значительно бо'льших х коэффициент а , возможно, станет меньше 1. Для проверки полученных значений в цикле по І вычислялись относительные отклонения функции:
5г. = к ■ N /171 п /1 _/ / -1 (16)
и по ним вычислялись следующие интегральные характеристики относительного отклонения:
Ех = шахді, Еп = ітііп^. Е2 =
/ кп-іОх (17)
р =
21
£|£,| / *т-10,Е3 = /Ля-/0.
V <о / V V -0 )
По этим характеристикам можно судить
об отклонении функции f (х), умноженной
на коэффициент к, от реальной зависимости Ы1_ (точнее, от обратной функции /IV). При к = 1 анализируется отклонение функции / * = Л' /1 п к . В соответствии с расчетами при т = 30000 ш к = 1 Е1—0 (все относительные отклонения отрицательны). Положительные отклонения появляются
при значениях к> а. При значениях к > А исчезают все отрицательные отклонения 5.
(Еп = 0). При значении множителя к в интервале от а до А есть отклонения 8 разных
знаков. При к «1.104 достигается минимум среднеквадратичной ошибки относительного
отклонения Е3 ~ 0.64 -10 2% (при к = 1 эта величина в 8.5 раз больше); при этом максимальное отклонение Е1 « 1.04% соответствует / = 26963, а минимальное значение Е2 « —12.04% соответствует / = 30.
Перейдем теперь к анализу функции, определенной через интегральный логарифм (3). В этом случае коэффициенты а, А определялись из неравенств
а-к-&2 !__</ IV/|^ А• к• ^ г*_>/ IV/|^(18)
В этих формулах £ - приближенное
значение интеграла в функции Гаусса с недостатком, а £ - значение с избытком. Неравенства (18) используются для поиска "оптимальных' коэффициентов для функции Гаусса, которая считается наиболее приближенной к я к . Характеристиками отклонения были те же величины (17), что и для функции / # _. При значении коэф-фициента к = 1 все относительные откло-нения положительны (интегральный лога-рифм больше всех / IV в интервале от /=10 до /=30000); максимальное относительное отклонение достигается при /=11 IV 1|1 = 31 . Уменьшение коэффициента ( к < 0.9986) приводит к появлению отрицательных значений отклонений. Первое отрицательное отклонение соответствует но-
меру /=29080 IV/_= 338473_. Минимум среднеквадратичной ошибки Е3 «0.00491% достигается при к«0.995 (при к = 1 Е3 «0.00587%).
При к < 0.8 значения функции интегрального логарифма лежат ниже значений І от 20 до 30000.
Кроме характеристик относительных отклонений рассматривались и соответствующие характеристики абсолютных отклонений. В табл. 2 приведены характеристики отклонений для трех значений множителя к .
Таблица 2
к Еі Еи Е 2 Е Е21 Ез
1 94.4(26217) 5.32(45) 48.6 48.6 0.295
0.998 57.6(26217) 2.38(29080) 27.6 27.6 0.167
0.995 23.4 -102.5 -26.7 31.8 0.237
Экстремальные значения отклонений соответствуют другим номерам простых чисел для относительных отклонений. По величине Еи заключаем, что смена знака отклонения действительно происходит при множителе к <0.998. Минимум среднеквадратичной ошибки не соответствует значению к « 0.95, которое определено для относительной ошибки. Все это указывает на то, что следует использовать различные критерии близости функций к реальным табличным данным.
Рассмотрим аппроксимационные свойства функции с параметром Ь
/*,*;=—Ц-. <19)
1п * -Ъ
Очевидно, что положительные значения параметра Ъ > 0 увеличивают значения функции, а отрицательные - уменьшают. Значение Ъ = 1 рекомендовал Чебышев, значение Ъ = 1.08366 - Лагранж. Для построения функций, ограничивающих я к сверху и снизу, предложены [4] значения 2 и -4. Функция (19) дает существенно завышенные значения при Ъ > 1 и малых х . Так, при Ъ = 1 относительное превышение менее 1% характерно лишь для простых чисел с номерами />116 (/V /|_> 641).
Результаты анализа зависимости (19) для различных значений параметра Ь в интервале от 2 до -4 представлены в табл. 3 (I изменялось от 30 до 30001).
Таблица 3
b E л _% En 12 % E 2 % E 21 % E3 %
2.0 44.04(31) 0 9.703 9.703 0.05708
1.5 22.50(31) 0 4.211 4.211 0.02481
1.115 9.857(31) 0 0.3505 0.3505 0.002763
1.10 9.417(31) 0.1330(2688) 0.2060 0.2063 0.002142
1.08633 9.019(31) 0.2646(2688) 0.07466 0.09194 0.001748
1.0755 8.706(31) 0.4044(2688) -0.02913 0.10775 0.001636
1.05 7.975(31) 0.6853(2688) -0.2726 0.3114 0.002162
1.00 6.571(31) -1.3807(258) -0.7466 0.7630 0.004489
0.5 0 -10.90(30) -5.245 5.245 0.03045
0 0 -20.42(30) -9.3489 9.3489 0.005430
-0.5 0 -27.94(30) -13.107 13.107 0.07611
-1.0 0 -34.23(30) -16.56 16.56 0.09615
-2.0 0 -44.01930) -22.70 22.70 0.1317
-4.0 0 -56.84(30) -32.60 32.60 0.1890
В табл. 3 указаны характеристики относительных ошибок в %. Определение этих величин приведены в (17). При значениях параметра 6 >1.115 Л,, = 0 и, следовательно, значения функции (19) лежат выше значений 1 N в таблице (при этом, естественно, Е2 — Е21). При Ъ< 0.5 Ех= 0 и, следовательно, значения функции (19) меньше значений в таблице простых чисел.
В довольно узком интервале Ь от 1.0 до 1.1 функция (19) дает как завышающие, так и занижающие значения. Напомним, что в этом интервале находится значение Ъ = 1, указанное Чебышевым для больших значений N, а также значение Ь = 1.08633, предложенное Лагранжем. Для рассмотренного интервала простых чисел с номерами от Ю = 30 до Ш = 30000 формула Лагранжа точнее формулы Чебышева (отношение соответствующих среднеквадратичных относительных
ошибок Е3 ~2.56). Это не означает, что Чебышев неправ, так как согласно его утверждениям преимущества его формулы скажутся за пределами рассмотренных значений простых чисел. Вызывает восхищение то, что Лагранж сумел найти значение параметра Ь, близкое к оптимальному. Расчеты показали, что оптимальное значение параметра
~ 1.0755 (при этом величина Е3 уменьшается по сравнению с величиной в варианте Лагранжа примерно на 6.8%). Для корректи-
ровки формулы типа Лагранжа согласно анализу Чебышева логично переписать ее в виде
<20)
В формуле Чебышева db = 0, а в формуле Лагранжа db = const = 0.08633 (уточненное нами значение db, =0.0755). Если потребовать от функции db к стремления к нулю при достаточно больших значениях x , то не будет противоречия, о котором упоминал Чебышев. Однако подобрать хорошую зависимость db к с упомянутым свойством непросто.
Вычисления показали, что при db = db, =0.0755 формула (19) дает завышенные значения при i < 5000, а при i > 6000- заниженные; в районе i « 5060 появляются как завышенные, так и заниженные значения. Этот анализ подсказал уменьшить db при малых i и слегка увеличить при больших
i . Вычислительный эксперимент со значениями
при i < 5060,
db й =0.0755-
5060
(21)
77 •- 0.01351-5060
с1Ь й = 0.0755 н-------------=■ при I > 5060
ш-5060
уменьшил среднеквадратичное отклонение Е на 18%. При этом максимальные отклонения (не относительные) укладываются в интервал от -22.85 до 37.56 (среднее отклонение по модулю менее 7.04); при постоянном значении
(ЛЬ этот интервал шире (от -43.91 до 43.91 при среднем отклонении по модулю 12.23).
В предложенной формуле (21) величина ЛЬ увеличивалась с ростом номера простого числа. Казалось бы, это противоречит требованию согласования с замечанием Чебышева. Противоречия нет. Просто значения, при которых, по-видимому, следует требовать асимптотического стремления
(22)
велики. Сам Чебышев указывал [13], что отличия формулы Лагранжа от его формулы будут значимыми лишь при значениях х >-107 (примерное равенство при х ж 1.247646-106). Указанным значениям X соответствуют номера / У 90 000. Отметим, что способ получения оценок [13] требует проверки, так как простой анализ показывает, что разность между аппроксимацией Лагранжа и Чебышева ( с1Ь = 0) монотонно убывает, достигая относительной разности менее 1% при х >16650.
Подведем итоги выполненных оценок функций, полагая, что ж к - реальная зависимость для номера простого числа, которой соответствует / IV в таблице. Полученные оценки трех функций сверху и снизу имеют вид X — X
1.0926-------<я* <1.25506---------(23)
In * __ " In #
0.80•// к j: ж * _< 0.9987-//
х -- х
In * -0.5
In* -1.115
(24)
(25)
Эти функции ближе к табличным значениям /IV по величине относительной ошибки при следующих "оптимальных" значениях коэффициентов
ж *
x
x
■ 0.995 • 1/1 j» 1.104------,(26)
1п*-1.115 1п#_
Функции указаны в порядке возрастания относительной среднеквадратичной погрешности со значениями
Еъ ж 0.0016, 0.0049, 0.0064% соответственно.
Указанные коэффициенты ждут своего уточнения за счет расширения таблицы простых чисел. При этом следует определиться с начальным значением интервала /0 (в данной
статье /0 = 30) и с критериями погрешности (относительными или абсолютными).
6. Расстояние между простыми числами
Расстояние между простыми числами di = N /|+ 1 — N /| ведет себя не монотонно,
но в целом расстояние , усредненное по
большому интервалу А/, и максимальное с1 т имеют тенденцию к увеличению. Известно несколько формул оценки сверху максимального расстояния:
^ *п\2 (27)
d^<F,= Ns
7
(28)
(29)
8 =-----YE.
... , - 12
Первая оценка (27) получена в работе [6] с использованием гипотезы Римана. Вторая оценка (28) получена посредством эвристических (вероятностных) рассуждений. Третья оценка (29) получена Huxley M.N. в 1973 г.
Эти формулы были проверены на интервале по номеру простого числа от 6 до 30 000. Оказалось, что все формулы дают завышенные значения (правые части неравенств могут быть уменьшены). В результате анализа определены поправочные коэффициенты для первой и второй формул и величина s для третьей формулы. Кроме того, указаны значения номеров ij, i2, в которых производилась последняя поправка для выполнения неравенств.
На рассмотренном интервале dm = 86 = l|4358^iV l|4357 . В формуле
(27) правая часть может быть умножена на ку = 0.43253 ^ = 6 , а в формуле (28) - на к2 =0.67155<2 =3385 . С учетом указанного в работе [4] значения d = 112 для N = 370261 и N + d коэффициент для второй формулы следует увеличить примерно на 1.5% до значения к2 =0.6813. Третья формула остается справедливой при £ = 0 . Кроме того, для третьей формулы был найден меньший показатель 8вместо 7/12 ж 0.583(3) 8 « 0.57144404 (последняя
поправка была выполнена для / = 9).
После корректировок было выяснено, что эти ограничения при х > 130 удовлетворяют неравенству
Fx > F3 > F2. (30)
Отсюда следует, что наиболее жесткие ограничения для максимального расстояния между простыми числами d дает вторая формула, а не третья, как утверждалось в [6]. При х = 1000, например, F3 /F^ :«0.457, а
F2/F1 * 0.057.
Гаусс обнаружил [1], что 26 379-я сотня не содержит простых чисел. Понятно, что появление такой сотни требует выполнения неравенства dm >101 (в худшем случае 200). Расчет показывает, что такая сотня обязательно найдется в интервале от 212 000 до 31 247 000. Сотня, найденная Гауссом (2 637 801-
2 637 899), попадает в указанный интервал.
Простая заниженная оценка для d
следует из известного и легко доказываемого факта [6] об отсутствии простых чисел на интервале Л!+2, п\+п . Отсюда следует, что d® > п — 2. Уже при п = 4 реальное dm = 4, а по оценке d® > 2.
7. Распределение близнецов
Близнецами (twins) называют соседние простые числа, отличающиеся на 2. Обобщением близнецов являются соседние простые числа, отличающиеся на число, кратное двум:
N i\+l~-N i\~=2-k, к = 1,2,... (31)
Расстояние между близнецами с ростом номера простого числа в целом увеличивается, но с нарушением монотонности.
Таблица 4_____________________________________
Например, между близнецами (71, 73) и ближайшими к ним (101, 103) находится 4 простых числа (расстояние между этими близнецами ДЛ''= 101-73 =28).
В то же время между близнецами (101, 103) и следующими (107, 109) нет ни одного простого числа. В 1959 г. была опубликована таблица близнецов в пределах 1.1 млн [2]. В работе [6] есть пример для близнецов: х = 8 004 119, х + 2, а в [1] - для еще более далеких: х = 100006108 \ х + 2. Есть основание предполагать, что близнецов бесчисленное множество, но это до сих пор не удалось доказать. На интервале до г = 30001 доля близнецов составляет «11.4%, с ростом интервала эта доля убывает.
Программа, вычисляющая число обобщенных близнецов (31), на выбранном интервале от i1 до i2 имела простой вид
for k:=1 to km do nn[k]:=0; for i:=i1 to i2 do for k:=1 to km do if (N[i+1]-N[i])=2*k then nn[k]:=nn[k]+1; for k:=1 to km begin s:=100*nn[k]/(i2-i1); writel n(k:8,s:9:6); end;
В табл. 4 указан процент чисел с разницей равной 2k на первой тысяче простых чисел (i1=1, i2=1000).
2 к 2 4 6 8 10 12 14
ппк % 17.417 16.917 24.424 8.408 10.010 7.507 4.294
Таблица 5
j 1 2 3 4 5 6
nn 1% 14.538 12.337 11.437 11.637 11.337 10.837
Заметно нарушение монотонного убы-Любопытно, что оказалось очень много вания числа близнецов. Возникает вопрос: пар для к = 3. Распределение близнецов какой выбрать интервал по номерам чисел (к = 1) на последовательных интервалах с длиной А/ = 3000 представлено в табл. 5 ( /
- номер интервала).
A/ = /2 — /1, при котором число близнецов будет монотонной функцией от номера интервала?
В табл. 6 для интервала A/ = const = 5000 представлены доли пп к Таблица 6
Как следует из табл. 6, число близнецов монотонно убывает с ростом номера интервала 7 ; однако при к = 3 значения пар на 5 и 6 интервалах совпали.
Доля следующих пар (к > 7) менее 6%, но при расширении интервала их доля будет естественно возрастать.
Перейдем к исследованию расстояния между ближайшими (соседними) близнецами. Дадим пояснения к соответствующей программе. Пусть (/11, /12) - номера простых
чисел ДЛЯ близнецов ( N 4 2 — N 4 1 2 ).
Начальные значения первых номеров близнецов равнялись /11 = 5, /12 = 6 (это соответствовало паре 11,13). Далее программа в цикле отыскивала номера простых чисел для ближайших близнецов (/21, /22) и вычисляла расстояние между ними по формуле
Ь = 2к = И 42 '• (32)
При этом в элементах массива пп к суммировались случаи с соответствующим значением к в формуле (31). Значения всех элементов этого массива позволяло вычислить и среднее расстояние между близнецами:
. . 2Vк-пп к ^ -
{L) = SL= ^ к 7Sk = Y.nnk . (33)
Верхняя граница суммирования в (33) определялась экспериментально. Признаком правильной верхней границы служила неизменность суммы Sk при существенном расширении верхней границы. В нашем случае достаточно было выбрать к = 318. Этому значению соответствовало наибольшее за-
для к = 1 и к = 3 (значение к = 3 выбрано по причине повышенного числа таких пар в табл. 4.
В табл. 7 приведено среднее число пар в процентном отношении к полному интервалу простых чисел до і =300 000:
фиксированное расстояние между близнецами: Ь = 2к = 636.
Анализ массива пп к позволил выяснить, что для проанализированного числа простых чисел (= 30001) найдено 3417 близнецов (без учета тех, для которых х < 13). Любопытно, что чаще всего встречались расстояния, соответствующие
А; = 14 £ = 28^ /7/71|4 ^ 278. При этом наименьшее расстояние, равное Ь = 4 , встретилось лишь 76 раз. На втором и третьем месте по численности оказались значения
пп ^0 _= 229 и пп 5| _= 222 для Ь = 40 и
Ь = 10 соответственно.
Число близнецов на интервалах с шагом А/ = 5000 простых чисел монотонно уменьшалось от 679 на первом интервале до 523 на последнем, шестом интервале. При этом среднее значение расстояния между близнецами монотонно возрастало: на первом
интервале (/ <5001) оно равнялось ~69.6, а на полном интервале ( / < 30001)~ 99.7 .
Наиболее интересный результат заключается в том, что многие расстояния между близнецами отсутствуют. Ненулевыми элементами массива пп к оказались лишь те, для которых к — 2 + Зп Л = 0,1,2,... и соответственно Ь = 4 + 6п. Формула
к = 2 + 3п *1 = 0,1,2,... _
І 1 2 3 4 5 6
пп\% 13.602 11.802 11.302 10.722 10.582 10.462
nn 3 % 21.504 18.743 18.083 17.843 17.283 17.283
Таблица 7
к = 1 k II ІЧ) СП II II к = 5 II
11.410 11.323 18.453 7.530 9.366 10.240
была справедлива до А: = 188. Затем стали появляться значения с AL = 6/ */ = 2 . Та-
ким образом, для определения расстояния между близнецами применяется формула L = 4 + 6л/ с целочисленными значениями
nj.
8. Бинарная проблема Г ольдбаха-Эйлера
После создания таблицы простых чисел анализировалось выполнение бинарной проблемы
M = N1+N2=Nfy~+N$\ (34)
для всех четных чисел M . Известно, что это равенство может выполняться разными способами. Например, 8=1+7=3+5,
10=3+7=5+5=7+3. Для однозначности представления полагалось, что N[i2] < N[i3] (или, что то же, i2 < i3). Это означает, что первое простое число меньше второго. Во всех проверенных случаях алгоритм обнаруживал выполнимость строгого неравенства N[i2] < N[i3]. Это не означает, что не было случаев равенства N[i2] = N[i3]. Просто алгоритм начинал проверку равенства с постепенным увеличением первого простого числа и прекращал работу при нахождении подходящей пары чисел. Число вариантов с равенством M=2N ф' подсчитывалось суммированием ситуаций, для которых выполнено неравенство 2N i\<MM.
Отметим, что равенство Гольдбаха (34) для некоторых M может выполняться тремя и более способами даже при условии Nx < N2. Например, 22=3+19=5+7=11+11, 24=1+23=5+19= 7+17=11+13. Эти случаи заслуживают особого внимания. Они обеспечивают некоторый "запас" выполнимости гипотезы (34).
Программа нахождения номеров простых чисел i2, i3, удовлетворяющих равенству (34), имела вид
MM:=400000; {maxM} jm:= MM shr 1-10; for j:=1 to jm do begin M:=20+2*j; for i:=0 to im do begin dm:=M-N[i]; i0:=i+Round(dm/sqr(ln(M))); if i0 > im then goto 20;
for i1:=i0 to im do begin if N[i1] > dm then goto 20; if dm=N[i1] then begin i2:=I; i3:=i1;
for k:=0 to km do if i2=k then nn[k]:=nn[k]+1;
goto 30; end; end; {for i1}
20: end; (for i} writeln(‘ impssible for M=’,M:9); goto 40;
30: end; (for j} writeln(‘ all was found’); writeln(‘ jm,M=’,jm:9,M:9);
40: {end program}
Дадим пояснения к программе. Задание величины MM определяет наибольшее значение числа M, для которого подбираются простые числа, удовлетворяющие гипотезе Гольдбаха (34). Верхняя граница цикла jm по j вычисляется по формуле исходя из условия, что образование числа M идет по формуле M:=20+2j. В цикле по i вычисляется величина разности dm=M-N[i], Далее организуется
цикл по /1 с начального значения /0 (эта величина сокращает перебор). Если выполняется одно из неравенств /0 > т, N[/1] > ёт происходит выход из поиска программы на печать информации о том, что для равенства (34) не найдена соответствующая пара простых чисел. При выполнении равенства ёт=Щг1] (а следовательно (34)) и нахождения номеров /2, 13 может быть вставлена программа обработки полученных значений. При завершении цикла по j печатается информация об удачном завершении прог-раммы и выдаются параметры, для которых выполнена проверка равенства (34).
В качестве верхней границы проверяемых чисел ММ можно брать значение почти вдвое большее Щ[/т]. Так, при N[30001] = 350381 программа находит пары чисел до значения А4М=699890 « 1.997--/¥[30001] (для меньших т соответствующий коэффициент при N г\п - меньше). Программа работает быстро при М < N г\п и резко замедляется при М > N г\п .
В первом столбце таблицы указано число рассмотренных чисел, во втором - процент случаев, когда простые числа в формуле (34) совпадают. Число таких случаев равно числу простых чисел, удовлетворяющих неравенству 2Щ/] < ММ. Заметим, что в программе всегда находились простые числа с номерами /2 < /3. Видно, что доля чисел с малыми значениями номеров простых чисел монотонно убывает.
Обнаружена интересная особенность для чисел пп[к] (£<14): при значениях ММ > Щ[/т] эти числа практически не изменялись, так как равенства (34) удовлетворялись при бо'льших номерах первого числа. Это свидетельствует о том, что для выполнения равенства (34) имеется большой запас, не говоря уже о выполнимости его при одинаковых значениях простых чисел. Проиллюстрируем разницу в выполнении равенства (34) для двух случаев: М > Щ[/ш] и М < Щ[/т]. Выберем одно и то же значение М=200 000 для Щ[15001]=163847 и Щ[30001]=350381. В первом случае выполняется первое неравенство, а во втором - второе. В первом случае для М найдено представление
М=Щ[3845]+Щ[14995]=36229+163771,
Заметим, что если задано завышенное число ММ, программа укажет то число, для которого не хватает нужной пары чисел из полученной таблицы простых чисел. После этого следует задать число ММ, меньшее на 2, и повторить счет. Время счета растет при увеличении ММ быстрее, чем ММ- 1п ММ _, и при ММ=500000 составляет примерно 54 сек. Алгоритм поиска чисел в равенстве (34) может быть оптимизирован. Можно, например, использовать информацию о предыдущей паре простых чисел.
Для анализа выполнимости гипотезы суммировались числа случаев с І2 =к для к, меняющегося от 0 до назначаемого номера кт. Соответствующие суммы накапливались в массиве пп[к]. Значение пп[0] указывает число случаев, когда первое число в гипотезе равно
1. Значение пп[1] естественно оказалось равным нулю, так как Л[1]=2 - единственное четное простое число. Представление о распределении пп[к] при различных значения ММ дает табл. 8.
а во втором случае
М=Щ[0]+Щ[17984]=1+199999 с наименьшим номером /2=0.
Видоизменение программы позволит выяснить число случаев, когда равенство (34) может быть выполнено более чем двумя способами.
Выводы
1. Приведены алгоритмы вычисления таблицы простых чисел и проверки бинарной проблемы Г ольдбаха.
2. Скорректированы оценки функций распределения простых чисел (логарифмический интеграл, функции Чебышева и Лагранжа) сверху и снизу.
3. Найдены приближенные значения коэффициентов, обеспечивающих минимум среднеквадратичного отклонения.
4. Предложена аппроксимация, согласующая формулу Лагранжа с асимптотикой Чебышева.
5. Уточнены формулы для оценки максимального расстояния между простыми числами, указана их относительная точность.
6. Проанализирована зависимость расстояния между близнецами и найдена форму-
Таблица 8
ММ т=т пп[0]% пп[2]% пп[3]% пп[4]% пп[5]%
1000 9.59% 17.98 15.82 13.69 10.23 8.50
2000 8.99 15.00 13.29 11.59 8.82 7.39
3000 8.665 10.00 8.86 7.73 5.88 4.92
ла, исключающая появление "запрещенных" расстояний.
7. Проверена справедливость гипотезы Гольдбаха до 700 тысяч и указаны возможности для анализа неоднозначного выполнения этой гипотезы.
Напомним, что все оценки получены для сравнительно малого (по современным меркам) числа простых чисел im=30 001. Предложенные алгоритмы могут быть использованы при параллельных вычислениях на современной технике. А для начала можно обойтись и без распараллеливания алгоритма. Для этого следует лишь воспользоваться возможностями динамического массива для хранения расширенной таблицы простых чисел. Следует считать результаты существенными при числе простых чисел более 10 миллионов.
Список литературы
1. Сушкевич А.К. Теория чисел (Элементарный курс). М: Вузовская книга, 2007. 240 с.
2. Бухштаб А.А. Теория чисел: уч. пос. СПб.; М.; Краснодар: Лань, 2008. 384 с.
3. Виноградов И.М. Основы теории чисел. М.: Лань, 2004 (десятое издание). 176 с.
4. Трост Э. Простые числа. М.: ИЛ, 1959. 136 с.
5. Прахар К. Распределение простых чисел. М.: Мир, 1967. 512 с.
6. Математическая энциклопедия (Распределение простых чисел). М.: Советская энциклопедия, 1984. Т.4
7. Интернет, Википедия, Проблема Гольдбаха, 19.11.2ОО9.
8. Weisstein, EricW. Goldbach Conjecture (на сайте Wolfram MathWorld).
9. Доксиадис A. Дядя Петрос и проблема Гольдбаха. М.: АСТ. 2ОО2.
10. Петров С. Абсолютное программирование. Рекурсия - пример типичной псевдоматема-тической попытки доказательства проблемы Гольдбаха методом просеивания.
11.Интернет, http://news.bbc.co.uk/hi/russian/sci/tech/newsi d 3б87000/3б87852^
12. Интернет (доказательство гипотезы Рима-на на 23 листах)
http://riemann.narod.ru/index.html
13. Чебышев П.Л. Об определении числа простых чисел, не превосходящих данной величины // Изб. тр. М.: Изд-во АН. 1955.
С.9-32.
14. Математический энциклопедический словарь. М.: Советская энциклопедия, 1988.
Possibilities of numerical methods for problems of number theory
E. L. Tarunin
Perm State University, Russia, 614990, Perm, Bukireva st., 15 [email protected]; (342) 237-10-31
A theory of numbers is famed for using of analytical methods. Grate mathematicians call the theory as a pearl of mathematics. Numerical methods and computers were used in the theory only in the second half of the 20 century. But I dare say that computers may be used more widely. The main aim of the article is to give impulse in that direction. Classical analytical methods deal with smooth functions but the real distribution of simple numbers is a discrete function. So it is more suitable for computers. It was shown that computers permit to find "optimal" parameters of different functions (Chebishev, Lagrange, integral logarithm) that can describe the real distribution of simple numbers more exactly. It was found also new properties of a distribution for so called wins. Corrections of the results will be done by next investigators by expansion of the tested table of simple numbers.
Key words: simple numbers; numerical methods; displasment of simple numbers; goldbod's problem.