Деление Ньютона-Рафсона На Большие Числа
Я делаю класс BigInt как упражнение по программированию. Он использует вектор 2-х дополняющих подписанных ints в base-65536 (так что 32-разрядные умножения не переполняются. Я увеличу базу, как только она полностью заработает).
все основные математические операции закодированы, с одной проблемой: деление больно медленно с основным алгоритмом, который я смог создать. (Это работает как двоичное деление для каждой цифры частного... Я не собираюсь его публиковать. если только кто-то не захочет посмотреть....)
вместо моего медленного алгоритма я хочу использовать Ньютона-Рафсона, чтобы найти (сдвинутый) взаимный, а затем умножить (и сдвинуть). Я думаю, что у меня есть голова вокруг основ: вы даете формулу (x1 = x0 (2 - x0 * делитель)) хорошее начальное предположение, а затем после некоторого количества итераций x сходится к взаимному. Эта часть кажется достаточно простой... но я сталкиваюсь с некоторыми проблемами при попытке применить эту формулу к big целые числа:
Проблема 1:
потому что я работаю с целыми числами... что ж... Я не могу использовать дроби. Это, по-видимому, заставляет x всегда расходиться (x0 * делитель должен быть d здесь d * [base^somePower]? Может ли быть какое-то уравнение типа (x1 = x0 (2 - x0 * d)), который работает с целыми числами?
Проблема 2:
когда я использую формулу Ньютона, чтобы найти реципрокность некоторых чисел, результат оказывается просто небольшой фракцией ниже того, что должен быть ответ... бывший. при попытке найти взаимное значение 4 (в десятичном формате):
x0 = 0.3
x1 = 0.24
x2 = 0.2496
x3 = 0.24999936
x4 = 0.2499999999983616
x5 = 0.24999999999999999999998926258176
Если бы я был представляя числа в базе-10, я хотел бы получить результат 25 (и не забыть сдвинуть вправо произведение на 2). С некоторыми reciprocals как 1/3, вы можете просто усечь Результат после того как вы знаете вы имеете достаточную точность. Но как я могу вытащить правильный ответный из вышеуказанного результата?
Извините, если это слишком расплывчато или если я прошу слишком много. Я просмотрел Википедию и все исследовательские работы, которые я мог найти в Google, но я чувствую, что я бьюсь головой о стена. Я ценю любую помощь, которую кто-либо может мне дать!
...
Edit: алгоритм работает, хотя он намного медленнее, чем я ожидал. Я действительно потерял много скорости по сравнению с моим старым алгоритмом, даже на числах с тысячами цифр... Я все еще чего-то не понимаю. Это не проблема с умножением, которое происходит очень быстро. (Я действительно использую алгоритм Карацубы).
для всех, кто заинтересован, вот моя текущая итерация Ньютона-Рафсона алгоритм:
bigint operator/(const bigint& lhs, const bigint& rhs) {
if (rhs == 0) throw overflow_error("Divide by zero exception");
bigint dividend = lhs;
bigint divisor = rhs;
bool negative = 0;
if (dividend < 0) {
negative = !negative;
dividend.invert();
}
if (divisor < 0) {
negative = !negative;
divisor.invert();
}
int k = dividend.numBits() + divisor.numBits();
bigint pow2 = 1;
pow2 <<= k + 1;
bigint x = dividend - divisor;
bigint lastx = 0;
bigint lastlastx = 0;
while (1) {
x = (x * (pow2 - x * divisor)) >> k;
if (x == lastx || x == lastlastx) break;
lastlastx = lastx;
lastx = x;
}
bigint quotient = dividend * x >> k;
if (dividend - (quotient * divisor) >= divisor) quotient++;
if (negative)quotient.invert();
return quotient;
}
и вот мой (очень некрасиво) старый алгоритм, который быстрее:
bigint operator/(const bigint& lhs, const bigint & rhs) {
if (rhs == 0) throw overflow_error("Divide by zero exception");
bigint dividend = lhs;
bigint divisor = rhs;
bool negative = 0;
if (dividend < 0) {
negative = !negative;
dividend.invert();
}
if (divisor < 0) {
negative = !negative;
divisor.invert();
}
bigint remainder = 0;
bigint quotient = 0;
while (dividend.value.size() > 0) {
remainder.value.insert(remainder.value.begin(), dividend.value.at(dividend.value.size() - 1));
remainder.value.push_back(0);
remainder.unPad();
dividend.value.pop_back();
if (divisor > remainder) {
quotient.value.push_back(0);
} else {
int count = 0;
int i = MSB;
bigint value = 0;
while (i > 0) {
bigint increase = divisor * i;
bigint next = value + increase;
if (next <= remainder) {
value = next;
count += i;
}
i >>= 1;
}
quotient.value.push_back(count);
remainder -= value;
}
}
for (int i = 0; i < quotient.value.size() / 2; i++) {
int swap = quotient.value.at(i);
quotient.value.at(i) = quotient.value.at((quotient.value.size() - 1) - i);
quotient.value.at(quotient.value.size() - 1 - i) = swap;
}
if (negative)quotient.invert();
quotient.unPad();
return quotient;
}
3 ответов
прежде всего, вы можете реализовать разделение во времени O(n^2)
и с умеренной постоянной, так что это не (намного) медленнее, чем наивное умножение. Однако, если вы используете Карацуба-как алгоритм, или даже ФФТ-основанный алгоритм умножения, тогда вы действительно можете ускорить свой алгоритм деления с помощью Ньютона-Рафсона.
итерация Ньютона-Рафсона для вычисления реципрокности x
is q[n+1]=q[n]*(2-q[n]*x)
.
Предположим, мы хотим вычислить floor(2^k/B)
здесь B
- положительное целое число. WLOG,B≤2^k
; в противном случае коэффициент 0
. Итерация Ньютона-Рафсона для x=B/2^k
доходность q[n+1]=q[n]*(2-q[n]*B/2^k)
. мы можем изменить его как
q[n+1]=q[n]*(2^(k+1)-q[n]*B) >> k
каждая итерация такого рода требует только целочисленных умножений и битовых сдвигов. Сходится ли оно к floor(2^k/B)
? Необязательно. Однако в худшем случае он в конечном итоге чередуется между floor(2^k/B)
и ceiling(2^k/B)
(докажите это!). Так что вы можете использовать некоторые не очень умный тест, чтобы увидеть, если вы в этом случае, и извлечь floor(2^k/B)
. (этот "не очень умный тест" должен быть намного быстрее, чем умножения на каждой итерации, однако, будет неплохо оптимизировать эту вещь).
в самом деле, вычисляя floor(2^k/B)
достаточно для того, чтобы вычислить floor(A/B)
для любых натуральных чисел A,B
. Взять k
такое, что A*B≤2^k
, и проверить floor(A/B)=A*ceiling(2^k/B) >> k
.
наконец, простая, но важная оптимизация для этого подхода заключается в усечении умножения (т. е. вычислять только высшие биты произведения) в ранних итерациях метода Ньютона-Рафсона. Причина этого в том, что результаты ранних итераций далеки от частного, и не имеет значения, чтобы выполнять их неточно. (Уточните этот аргумент и покажите, что если вы сделаете это правильно, вы можете разделить два ≤n
- разрядные целые числа во времени O(M(2n))
, предполагая, что вы можете умножить два ≤k
-разрядные целые числа во времени M(k)
и M(x)
- это увеличение выпуклой функции).
Если я вижу это правильно, основным улучшением является выбор хорошего начального значения для x. Зная, сколько цифр у делителя, вы знаете, где должен быть самый значительный бит обратного, как
1/x = pow(2,log2(1/x))
1/x = pow(2,-log2(x))
1/x >= pow(2,-floor(log2(x)))
floor (log2 (x)) просто является индексом наиболее значительного набора битов.
Ньютон-Рафсон-это аппроксимационный алгоритм, не подходящий для использования в целочисленной математике. Вы получите ошибки округления, которые приведут к таким проблемам, которые вы видите. Вы можете решить проблему с числами с плавающей запятой, а затем посмотреть, получите ли вы целое число с точностью до заданного числа цифр (см. следующий абзац)
Что касается второй проблемы, выберите точность (количество десятичных знаков), которую вы хотите для точности и округлить до этой точности. Если вы выбрали двадцать цифры точности в задаче, вы бы округлить до 0.25. Вам просто нужно повторять, пока требуемые цифры точности не станут стабильными. В общем, представление иррациональных чисел на компьютере часто вводит неточность.