Легальные пользователи моего сайта иногда забивают сервер запросами API, которые вызывают нежелательные результаты. Я хочу установить ограничение не более, чем сказать один вызов API каждые 5 секунд или n вызовов в минуту (пока не определился с точным ограничением). Я мог бы зарегистрировать каждый вызов API в БД и выполнить расчет по каждому запросу, чтобы убедиться, что он превысил лимит, но все эти дополнительные накладные расходы при каждом запросе будут побеждать цель. Какие другие менее ресурсоемкие методы я мог бы использовать, чтобы установить лимит? Я использую PHP / Apache / Linux, для чего это стоит.
Хорошо, нет способа делать то, что я просил, без каких-либо операций записи на сервер, но я могу, по крайней мере, исключить протоколирование каждого отдельного запроса. Одним из способов является использование метода дросселирования «просачивающегося ковша», где он отслеживает только последний запрос ( $last_api_request
) и отношение количества запросов / ограничений для временного интервала ( $minute_throttle
). Непроницаемое ведро никогда не сбрасывает счетчик (в отличие от дросселя API-интерфейса Twitter, который сбрасывается каждый час), но если ковш становится заполненным (пользователь достигает предела), они должны ждать n
секунд, пока ведро не опустошит немного, прежде чем они смогут сделать другой запрос , Другими словами, это похоже на ограничение качения: если в течение периода времени есть предыдущие запросы, они медленно вытекаются из ведра; это только ограничивает вас, если вы заполняете ведро.
Этот фрагмент кода будет вычислять новое значение $minute_throttle
для каждого запроса. Я указал минуту в $minute_throttle
потому что вы можете добавлять дроссели в течение любого периода времени, например, ежечасно, ежедневно и т. Д. … хотя более одного из них быстро начнут запутывать пользователей.
$minute = 60; $minute_limit = 100; # users are limited to 100 requests/minute $last_api_request = $this->get_last_api_request(); # get from the DB; in epoch seconds $last_api_diff = time() - $last_api_request; # in seconds $minute_throttle = $this->get_throttle_minute(); # get from the DB if ( is_null( $minute_limit ) ) { $new_minute_throttle = 0; } else { $new_minute_throttle = $minute_throttle - $last_api_diff; $new_minute_throttle = $new_minute_throttle < 0 ? 0 : $new_minute_throttle; $new_minute_throttle += $minute / $minute_limit; $minute_hits_remaining = floor( ( $minute - $new_minute_throttle ) * $minute_limit / $minute ); # can output this value with the request if desired: $minute_hits_remaining = $minute_hits_remaining >= 0 ? $minute_hits_remaining : 0; } if ( $new_minute_throttle > $minute ) { $wait = ceil( $new_minute_throttle - $minute ); usleep( 250000 ); throw new My_Exception ( 'The one-minute API limit of ' . $minute_limit . ' requests has been exceeded. Please wait ' . $wait . ' seconds before attempting again.' ); } # Save the values back to the database. $this->save_last_api_request( time() ); $this->save_throttle_minute( $new_minute_throttle );
Вы можете контролировать скорость с помощью алгоритма маркера токенов , что сопоставимо с алгоритмом негерметичного ковша. Обратите внимание, что вам придется разделить состояние ведра (то есть количество токенов) над процессами (или любой объем, который вы хотите контролировать). Поэтому вы можете подумать о блокировке, чтобы избежать условий гонки.
Хорошие новости: я сделал все это для вас: пропускная способность – дроссель / токен-ведро
use bandwidthThrottle\tokenBucket\Rate; use bandwidthThrottle\tokenBucket\TokenBucket; use bandwidthThrottle\tokenBucket\storage\FileStorage; $storage = new FileStorage(__DIR__ . "/api.bucket"); $rate = new Rate(10, Rate::SECOND); $bucket = new TokenBucket(10, $rate, $storage); $bucket->bootstrap(10); if (!$bucket->consume(1, $seconds)) { http_response_code(429); header(sprintf("Retry-After: %d", floor($seconds))); exit(); }
Я не знаю, жив ли этот поток или нет, но я бы предложил сохранить эти статистические данные в кеше памяти, например memcached. Это уменьшит накладные расходы на ведение журнала запроса в БД, но все еще будет служить цели.
Самое простое решение состоит в том, чтобы просто дать каждому ключу API ограниченное количество запросов в течение 24 часов и сбросить их в какое-то известное фиксированное время.
Если они исчерпывают свои запросы API (т. Е. Счетчик достигает нуля или лимит, в зависимости от направления, которое вы подсчитываете), прекратите подавать их данные до тех пор, пока вы не сбросите их счетчик.
Таким образом, в их интересах будет не забивать вас запросами.
Вы говорите, что «все лишние накладные расходы при каждом запросе будут побеждать цель», но я не уверен, что это правильно. Разве это не цель предотвращения взлома вашего сервера? Вероятно, это способ реализовать, так как это требует только быстрого чтения / записи. Вы даже можете обработать проверки сервера API на другой DB / диск, если вас беспокоит производительность.
Однако, если вы хотите альтернативы, вы должны проверить mod_cband , сторонний модуль apache, предназначенный для поддержки дросселирования полосы пропускания. Несмотря на то, что в основном это ограничение пропускной способности, он также может работать на основе запросов в секунду. Я никогда не использовал его, поэтому я не уверен, какие результаты вы получите. Был еще один модуль, называемый mod-throttle, но этот проект, похоже, сейчас закрыт и никогда не был выпущен для чего-либо выше серии Apache 1.3.
Помимо реализации с нуля вы также можете взглянуть на инфраструктуру API, такую как 3scale ( http://www.3scale.net ), которая ограничивает скорость, а также множество других материалов (аналитика и т. Д.). Для него есть плагин PHP: https://github.com/3scale/3scale_ws_api_for_php .
Вы также можете использовать что-то вроде Varnish infront API и ограничивать скорость API.