동시호출에 대한 리밋은 없다. 하지만 분당 호출량이나 분당 최대 토큰 사용량으로 리밋이 정해져 있다.
3.5-turbo 기준 Pay-as-you-go users (after 48 hours) 라면, 3500RPM 이나 90000TPM을 초과할 수 없다.
일반적으로 많이 사용할 gpt-4는 200RPM, 40000TPM이다. gpt-4-32k는 역시나 20RPM으로 호출제한이 크고 150000TPM으로 토큰량은 크다.
리밋제한을 풀어달라고 openAI에 요청할수 있다. 적절한 사유와 함께 요청을 하면 수일 이내에 응답을 준다고 한다.