Дифференциальное исчисление - Differential calculus

График функции, нарисованный черным цветом, и касательная линия к этой функции, нарисованная красным. Наклон касательной равен производной функции в отмеченной точке.

В математике , дифференциальное исчисление является подполом исчисления , что исследования скорости , при которой величинах изменяются. Это один из двух традиционных разделов исчисления, другой - интегральное исчисление - изучение области под кривой.

Основные объекты исследования в дифференциальном исчислении являются производной из функции , связанные понятия , такие как дифференциал и их применение. Производная функции при выбранном входном значении описывает скорость изменения функции вблизи этого входного значения. Процесс нахождения производной называется дифференцированием . Геометрически производная в точке является наклон по касательной к графику функции в этой точке, при условии , что производная существует и определяется в этой точке. Для действительной функции одной действительной переменной производная функции в точке обычно определяет наилучшее линейное приближение к функции в этой точке.

Дифференциальное исчисление и интегральное исчисление связаны основной теоремой исчисления , которая гласит, что дифференцирование - это процесс, обратный интегрированию .

Дифференциация применяется почти во всех количественных дисциплинах. В физике производная смещения движущегося тела по времени - это скорость тела, а производная скорости по времени - это ускорение . Производная количества движения тела по времени равна силе, приложенной к телу; переставляя эту производную выписку приводит к известной F = т в уравнении , связанное с вторым законом Ньютона . Скорость реакции из химической реакции , представляет собой производное. При исследовании операций производные инструменты определяют наиболее эффективные способы транспортировки материалов и проектирования предприятий.

Производные часто используются для нахождения максимумов и минимумов функции. Уравнения, включающие производные, называются дифференциальными уравнениями и являются фундаментальными для описания природных явлений . Производные и их обобщения появляются во многих областях математики, таких как комплексный анализ , функциональный анализ , дифференциальная геометрия , теория меры и абстрактная алгебра .

Производная

График произвольной функции . Оранжевая линия является касательной , что означает, что в этой точной точке наклон кривой и прямой совпадают.
Производная дифференцируемой функции в разных точках

Производная от в точке - это наклон касательной к . Чтобы получить интуитивное представление об этом, нужно сначала научиться находить наклон линейного уравнения, записанного в форме . Наклон уравнения - это его крутизна. Его можно найти, выбрав любые две точки и разделив изменение на изменение , что означает это . Для графика имеет наклон , как показано на диаграмме ниже:

График

Для краткости часто записывается как , с будучи греческой буквы дельта, что означает «изменение». Наклон линейного уравнения постоянный, что означает, что крутизна везде одинакова. Однако, например, многие графики различаются по крутизне. Это означает, что вы больше не можете выбрать две произвольные точки и вычислить уклон. Вместо этого наклон графика можно вычислить, рассматривая касательную линию - линию, которая «только касается» определенной точки. Наклон кривой в определенной точке равен наклону касательной к этой точке. Например, имеет наклон в, потому что наклон касательной к этой точке равен :

График , с прямой линией, касающейся . Наклон касательной равен . (Обратите внимание, что на осях графика не используется масштаб 1: 1.)

Тогда производная функции - это просто наклон этой касательной. Даже если касательная линия касается только одной точки в точке касания, ее можно аппроксимировать линией, проходящей через две точки. Это называется секущей линией . Если две точки, через которые проходит секущая линия, расположены близко друг к другу, то секущая линия очень похожа на касательную, и, как следствие, ее наклон также очень похож:

Пунктирная линия проходит через точки и , обе лежащие на кривой . Поскольку эти две точки расположены довольно близко друг к другу, пунктирная линия и касательная имеют одинаковый наклон. По мере того, как две точки становятся ближе друг к другу, ошибка, создаваемая секущей линией, становится исчезающе малой.

Преимущество использования секущей линии состоит в том, что ее наклон можно вычислить напрямую. Рассмотрим две точки на графике и , где - небольшое число. Как и раньше, наклон линии, проходящей через эти две точки, можно рассчитать по формуле . Это дает

По мере приближения к , наклон секущей линии становится все ближе и ближе к наклону касательной. Формально это записывается как

Вышеприведенное выражение означает, что «по мере приближения к 0 наклон секущей линии становится все ближе и ближе к определенному значению». Значение, к которому приближаются, является производной от ; это можно записать как . Если , производная также может быть записана как , представляя бесконечно малое изменение. Например, представляет бесконечно малое изменение x. Таким образом, если , то производная от равна

при условии, что такой предел существует. Таким образом, нам удалось правильно определить производную функции, а это означает, что «наклон касательной линии» теперь имеет точное математическое значение. Дифференциация функции с использованием приведенного выше определения называется дифференцированием от первых принципов. Вот доказательство, используя дифференциацию из первых принципов, что производная является :

Как подходит , подходит . Поэтому . Это доказательство можно обобщить, чтобы показать, что если и являются константами . Это известно как правило власти . Например, . Однако многие другие функции не могут быть дифференцированы так же легко, как полиномиальные , а это означает, что иногда требуются дополнительные методы, чтобы найти производную функции. Эти методы включают цепное правило , правила продукта , и фактор правило . Другие функции вообще не могут быть дифференцированы, что дает начало концепции дифференцируемости .

Понятие, тесно связанное с производной функции, - это ее дифференциал . Когда x и y - действительные переменные, производная f в x - это наклон касательной к графику f в x . Поскольку источник и цель f одномерны, производная f является действительным числом. Если x и y - векторы, то наилучшее линейное приближение к графику f зависит от того, как f изменяется сразу в нескольких направлениях. Выбор наилучшего линейного приближения в одном направлении определяет частную производную , которую обычно обозначают y/x. Линеаризация f сразу во всех направлениях называется полной производной .

История дифференциации

Концепция производной в смысле касательной линии очень древняя и знакома греческим геометрам, таким как Евклид (около 300 г. до н.э.), Архимед (около 287–212 до н.э.) и Аполлоний Пергский (около 262–212 гг . До н.э.) 190 г. до н.э.). Архимед также использовал неделимые , хотя они в основном использовались для изучения областей и объемов, а не производных и касательных (см . Метод механических теорем ).

Использование бесконечно малых величин для изучения скорости изменения можно найти в индийской математике , возможно, еще в 500 году нашей эры, когда астроном и математик Арьябхата (476–550) использовал бесконечно малые величины для изучения орбиты Луны . Использование бесконечно малых величин для вычисления скорости изменения было значительно развито Бхаскарой II (1114–1185); действительно, утверждалось, что многие ключевые понятия дифференциального исчисления можно найти в его работе, например, в « теореме Ролля ».

Исламский математик , Шараф аль-Дин аль-Туси (1135-1213) в своем трактате по уравнениям , установленные условия для некоторых кубических уравнений есть решения, находя максимумы соответствующих кубических полиномов. Он доказал, например, что максимум кубической ax 2 - x 3 происходит при x = 2 a / 3 , и на основании этого пришел к выводу, что уравнение ax 2 - x 3 = c имеет ровно одно положительное решение, когда c = 4 a 3 / 27 , и два положительных решения , когда 0 < с <4 3 /27 . Историк науки Рошди Рашед утверждал, что ат-Туси, должно быть, использовал производную кубики для получения этого результата. Вывод Рашеда, однако, оспаривается другими учеными, которые утверждают, что он мог получить результат другими методами, которые не требуют знания производной функции.

Современное развитие исчисления обычно приписывают Исааку Ньютону (1643–1727) и Готфриду Вильгельму Лейбницу (1646–1716), которые предоставили независимые и унифицированные подходы к дифференцированию и производным. Однако ключевым открытием, которое принесло им это признание, была фундаментальная теорема исчисления, касающаяся дифференцирования и интеграции: это сделало устаревшими большинство предыдущих методов вычисления площадей и объемов, которые не были значительно расширены со времен Ибн аль-Хайсама ( Альхазен). В своих идеях о производных и Ньютон, и Лейбниц основывались на более ранних работах математиков, таких как Пьер де Ферма (1607–1665), Исаак Барроу (1630–1677), Рене Декарт (1596–1650), Христиан Гюйгенс (1629–1695). ), Блез Паскаль (1623–1662) и Джон Уоллис (1616–1703). Что касается влияния Ферма, Ньютон однажды написал в письме, что « я получил намек на этот метод [флюксий] из способа рисования касательных Ферма, и, применив его к абстрактным уравнениям, прямо и в обратном направлении, я сделал его общим». Исаак Барроу. обычно считается ранней разработкой производного инструмента. Тем не менее, Ньютон и Лейбниц остаются ключевыми фигурами в истории дифференциации, не в последнюю очередь потому, что Ньютон был первым, кто применил дифференциацию к теоретической физике , в то время как Лейбниц систематически развил большую часть обозначений, используемых до сих пор.

С 17 века многие математики внесли свой вклад в теорию дифференцирования. В XIX веке исчисление было поставлено на более строгую основу такими математиками, как Огюстен Луи Коши (1789–1857), Бернхард Риман (1826–1866) и Карл Вейерштрасс (1815–1897). Также в этот период дифференцирование было распространено на евклидово пространство и комплексную плоскость .

Приложения деривативов

Оптимизация

Если F является дифференцируемой функцией на (или открытый интервал ) и х представляет собой локальный максимум или локальный минимум из F , то производная F по х равен нулю. Точки, где f ' ( x ) = 0 , называются критическими точками или стационарными точками (а значение f в x называется критическим значением ). Если не предполагается, что f всюду дифференцируема, то точки, в которых она не дифференцируема, также называются критическими точками.

Если F дважды дифференцируема, то наоборот, критическая точка х из F можно анализировать, рассматривая вторую производную от F по х  :

  • если он положительный, x - локальный минимум;
  • если он отрицательный, x - локальный максимум;
  • если он равен нулю, то x может быть локальным минимумом, локальным максимумом или ни тем, ни другим. (Например, f ( x ) = x 3 имеет критическую точку при x = 0 , но не имеет там ни максимума, ни минимума, тогда как f ( x ) = ± x 4 имеет критическую точку при x = 0 и a минимум и максимум там соответственно.)

Это называется тестом второй производной . Альтернативный подход, называемый тестом первой производной , включает рассмотрение знака f ' по обе стороны от критической точки.

Поэтому получение производных и решение для критических точек часто является простым способом найти локальные минимумы или максимумы, которые могут быть полезны при оптимизации . По теореме об экстремальном значении непрерывная функция на отрезке должна хотя бы один раз достичь своих минимальных и максимальных значений. Если функция дифференцируема, минимумы и максимумы могут возникать только в критических точках или конечных точках.

Это также имеет приложения при построении эскизов графиков: после того, как были найдены локальные минимумы и максимумы дифференцируемой функции, можно получить приблизительный график графика, наблюдая, что он будет либо увеличиваться, либо уменьшаться между критическими точками.

В более высоких измерениях критической точкой скалярнозначной функции является точка, в которой градиент равен нулю. Вторая производная тест по- прежнему может быть использован для анализа критических точек, рассматривая собственные значения на гессенскую матрице вторых частных производных функции в критической точке. Если все собственные значения положительны, то точка является локальным минимумом; если все отрицательные, это локальный максимум. Если есть некоторые положительные и некоторые отрицательные собственные значения, то критическая точка называется « седловой точкой », и если ни один из этих случаев не выполняется (т. Е. Некоторые из собственных значений равны нулю), тогда проверка считается безрезультатной.

Вариационное исчисление

Один из примеров задачи оптимизации: найти кратчайшую кривую между двумя точками на поверхности, предполагая, что кривая также должна лежать на поверхности. Если поверхность плоская, то самая короткая кривая - это линия. Но если поверхность, например, яйцевидной формы, то кратчайший путь не сразу ясен. Эти пути называются геодезическими , и одна из самых фундаментальных проблем вариационного исчисления - это поиск геодезических. Другой пример: найдите поверхность с наименьшей площадью, заполняющую замкнутую кривую в пространстве. Эта поверхность называется минимальной поверхностью, и ее тоже можно найти с помощью вариационного исчисления.

Физика

Исчисление имеет жизненно важное значение в физике: многие физические процессы описываются уравнениями с производными, называемыми дифференциальными уравнениями . Физика особенно озабочена тем, как величины меняются и развиваются во времени, а концепция « производной по времени » - скорости изменения во времени - необходима для точного определения нескольких важных понятий. В частности, в ньютоновской физике большое значение имеют производные от положения объекта по времени :

  • скорость - это производная (по времени) смещения объекта (расстояние от исходного положения)
  • Ускорение - это производная (по времени) от скорости объекта, то есть вторая производная (по времени) от положения объекта.

Например, если положение объекта на линии задается

то скорость объекта равна

а ускорение объекта равно

которая постоянна.

Дифференциальные уравнения

Дифференциальное уравнение - это отношение между набором функций и их производными. Обыкновенное дифференциальное уравнение представляет собой дифференциальное уравнение, связывающее функции одной переменной к их производных по этой переменной. Парциальное дифференциальное уравнение представляет собой дифференциальное уравнение, связывающее функции более чем одной переменной к их частных производных . Дифференциальные уравнения естественным образом возникают в физических науках, в математическом моделировании и в самой математике. Например, второй закон Ньютона , описывающий взаимосвязь между ускорением и силой, можно сформулировать как обыкновенное дифференциальное уравнение

Уравнение теплопроводности в одной пространственной переменной, которое описывает, как тепло распространяется через прямой стержень, является уравнением в частных производных

Здесь u ( x , t ) - температура стержня в положении x и времени t, а α - константа, которая зависит от того, насколько быстро тепло распространяется через стержень. (2-3¡) - (3 + 2)

Теорема о среднем значении

Теорема о среднем значении: для каждой дифференцируемой функции с существует с .

Теорема о среднем значении устанавливает связь между значениями производной и значениями исходной функции. Если f ( x ) - вещественная функция, а a и b - числа с a < b , то теорема о среднем значении говорит, что при мягких гипотезах наклон между двумя точками ( a , f ( a )) и ( b , f ( b )) равен наклону касательной к f в некоторой точке c между a и b . Другими словами,

На практике теорема о среднем значении управляет функцией в терминах ее производной. Например, предположим, что производная f в каждой точке равна нулю. Это означает, что его касательная линия горизонтальна в каждой точке, поэтому функция также должна быть горизонтальной. Теорема о среднем значении доказывает, что это должно быть правдой: наклон между любыми двумя точками на графике f должен равняться наклону одной из касательных к f . Все эти наклоны равны нулю, поэтому любая линия от одной точки на графике до другой также будет иметь нулевой наклон. Но это говорит о том, что функция не перемещается вверх или вниз, поэтому это должна быть горизонтальная линия. Более сложные условия на производную приводят к менее точной, но все же очень полезной информации об исходной функции.

Многочлены Тейлора и ряды Тейлора

Производная дает наилучшее линейное приближение функции в данной точке, но она может сильно отличаться от исходной функции. Один из способов улучшить приближение - использовать квадратичное приближение. Другими словами, линеаризация вещественнозначной функции f ( x ) в точке x 0 является линейным многочленом a + b ( x - x 0 ) , и можно получить лучшее приближение, рассматривая квадратичный многочлен a + b ( x - x 0 ) + c ( x - x 0 ) 2 . Еще лучше мог бы быть кубический многочлен a + b ( x - x 0 ) + c ( x - x 0 ) 2 + d ( x - x 0 ) 3 , и эту идею можно распространить на многочлены сколь угодно высокой степени. Для каждого из этих многочленов должен быть наилучший выбор коэффициентов a , b , c и d, который делает приближение как можно лучше.

В окрестностях от й 0 , для более лучшего возможного выбора всегда F ( х 0 ) , и б наилучшего выбора всегда е» ( х 0 ) . Для коэффициентов c , d и более высоких степеней эти коэффициенты определяются высшими производными от f . c всегда должно бытьf '' ( х 0 )/2, и d всегда должно бытьf '' ' ( х 0 )/3!. Использование этих коэффициентов дает многочлен Тейлора функции f . Многочлен Тейлора степени d - это многочлен степени d, который наилучшим образом приближает f , а его коэффициенты могут быть найдены путем обобщения приведенных выше формул. Теорема Тейлора дает точную оценку того, насколько хорошее приближение. Если f - многочлен степени меньше или равной d , то многочлен Тейлора степени d равен f .

Предел многочленов Тейлора представляет собой бесконечный ряд, называемый рядом Тейлора . Ряд Тейлора часто является очень хорошим приближением к исходной функции. Функции, которые равны своим рядам Тейлора, называются аналитическими функциями . Функции с разрывами или острыми углами не могут быть аналитическими; кроме того, существуют гладкие функции, которые также не являются аналитическими.

Теорема о неявной функции

Некоторые естественные геометрические формы, такие как круги , нельзя нарисовать как график функции . Например, если f ( x , y ) = x 2 + y 2 - 1 , то круг - это множество всех пар ( x , y ) таких, что f ( x , y ) = 0 . Этот набор называется нулевым набором f и отличается от графика f , который является параболоидом . Теорема о неявной функции преобразует такие отношения, как f ( x , y ) = 0, в функции. Он утверждает , что если е является непрерывно дифференцируемым , то вокруг большинства точек, нулевое множество F выглядит как графики функций склеенных. Точки, в которых это не так, определяются условием на производную f . Кружок, например, можно склеить из графиков двух функций ± 1 - x 2 . В окрестности каждой точки на окружности, кроме (−1, 0) и (1, 0) , одна из этих двух функций имеет график, который выглядит как окружность. (Эти две функции также встречаются (−1, 0) и (1, 0) , но это не гарантируется теоремой о неявной функции.)

Теорема о неявной функции тесно связана с теоремой об обратной функции , в которой говорится, когда функция выглядит как склеенные вместе графики обратимых функций .

Смотрите также

Примечания

использованная литература