Łączenie serwerów proxy jest mechanizmem umożliwiającym utworzenie hierarchicznego ciągu serwerów proxy. Każdy komponent Caching Proxy w ciągu serwerów proxy należy do określonego poziomu hierarchii. Jeśli serwer proxy na najniższym poziomie hierarchii nie jest w stanie obsłużyć żądanego adresu URL z poziomu z jego pamięci podręcznej, przekazuje to żądanie do serwera proxy na kolejnym poziomie hierarchii, zamiast przekazywać żądanie natychmiast do serwera treści WWW. Ta metoda zwiększa prawdopodobieństwo, że żądany plik zostanie znaleziony w pamięci podręcznej. Im wyższy jest poziom w ciągu, tym większa liczba użytkowników uzyskuje dostęp do danego serwera proxy.
Jeśli żądany dokument nie zostanie znaleziony w pamięci podręcznej serwera proxy na najwyższym poziomie, to serwer proxy kontaktuje się z serwerem treści WWW w celu pobrania danego dokumentu. Serwer proxy, który pobrał dokument, przekazuje go do klienta i do wszystkich serwerów proxy na niższych poziomach hierarchii, aby zbuforowały one ten dokument. Dokument zostaje zbuforowany również przez serwer proxy, który go pobrał.
Jeśli pośredni serwer proxy zbuforował kopię żądanego zasobu, zwraca on kopię bezpośrednio z pamięci podręcznej do klienta, który wysłał żądanie, bez przekazywania żądania do serwera WWW, z którego pochodzi ten dokument.
Należy zauważyć, że łączenie serwerów proxy powoduje większe opóźnienia w procesie wysyłania żądania. Zalecanym limitem jest połączenie dwóch serwerów proxy. Łączenie serwerów proxy ma sens w przypadku dużej organizacji, gdzie "mały" serwer proxy blisko użytkowników (na przykład w biurze oddziału) można połączyć z "dużym" serwerem proxy, który jest bezpośrednio połączony z Internetem.