Descrição do primeiro padrão de SSTV.
 

Esta foi a primeira imagem de SSTV que eu consegui captar (em 1981), usando um demodulador FM de fabricação própria e um osciloscópio, no qual a base de tempo era ajustada manualmente na metade da frequencia de varredura (em 7,5 Hz) resultando em duas imagens, sendo uma com as linhas pares e a outra com as linhas impares da varredura de 120 linhas, com tempo total de 8 segundos.

Para entender melhor os sistemas atuais de SSTV, começamos estudando o antigo, que foi apenas adaptado para as necessidades atuais.
Veja aqui algumas imagens feitas no modo antigo de 120 linhas em 8 segundos (BW8).

SSTV significa Slow Scan TeleVision, televisão de varredura lenta, (15 Hz no modo antigo), em comparação a TV normal, tambem chamada pelos radioamadores de FSTV (Fast Scan TV) onde a varredura é bem mais rápida (15734,264 Hz no Brasil), para permitir a ilusão de movimento.
A lentidão é devida á banda estreita disponível nos transcetores de SSB, como será demonstrado a seguir, e como consequencia só permite a transmissão de imagens fixas, como em FAX.
Apesar disso, no modo antigo era possível fazer movimentos em camera bem lenta, enviando imagens em sequencia, de 8 em 8 segundos, ou obter efeitos interessantes em tubos com fósforo P7, com superposição de imagens devido a alta persistencia.

A SSTV foi inventada por VY2CM Copthorne McDonald, em 1957 e seu uso foi regulamentado em 1968 nas faixa de radioamadores.

O primeiro padrão de SSTV largamente usado foi 120 linhas em 8 segundos, imagem quadrada e monocromática. Na época os PC estavam no inicio e caríssimos e nem se pensava em usa-los para SSTV. Eram usados monitores com tubo de raios catódicos com tela de fósforo P7 de alta persistência, para reter a imagem durante no mínimo os 8 segundos da sua transmissão e visível somente num ambiente escuro...
A imagem é transformada, na transmissão, em um sinal de audio modulado em freqüência, FM, cuja banda não pode ser maior do que 3 kHz para caber nos filtros dos transceptores SSB.(em media de 300 a 3300 Hz).
Um ponto preto da imagem gera 1500 Hz e um ponto branco da imagem gera 2300 Hz. Um ponto cinza produz uma freqüência  entre 1500 e 2300 Hz, diretamente proporcional ao seu grau de cinza na escala cujos limites são o preto e o branco. Portanto e por definição, SSTV é uma transmissão ANALÓGICA e assim o é até hoje (vide modos atuais mais adiante).
A imagem é varrida em 120 linhas horizontais, 15 vezes por segundo, gastando portanto 120/15=8 segundos. A varredura era feita mecanicamente (como num FAX) ou eletronicamente por diversos processos. Para sincronizar a verredura do monitor, cada linha começa com um pulso de sincronismo horizontal de 5 ms em 1200Hz. No final da imagem (e/ou inicio de uma nova) havia um pulso de sincronismo vertical, de 30 ms em 1200Hz. A resolução horizontal era de 120 pontos. Portanto, a imagem não podia conter mais do que 60 linhas brancas verticais intercaladas com 60 linhas pretas verticais, resultando num sinal de vídeo com 60 ciclos de vídeo por linha e portanto com uma freqüência fundamental máxima de 60x15 = 900 Hz. ( um ponto branco seguido por um ponto preto formam um ciclo de menor duração possível de sinal de vídeo ).
( veja melhor como é gerado um ciclo do sinal de vídeo em resolução).
Como a banda ocupada por um sinal de FM é aproximadamente igual ao desvio de freqüência pico a pico mais o dobro da maior freqüência do sinal modulante (no caso o sinal de vídeo), temos B=(2300-1500)+2x900=2600 Hz, com centro em (1500+2300)/2=1900 Hz, ou seja, ocupa a banda de 600 até 3200 Hz, o que cabe sem muita folga num filtro de transceptor SSB..., ou com um pouco mais de folga num transceptor FM ou AM.
Está claro agora porque foram escolhidas somente 120 linhas e somente 15 varreduras horizontais por segundo.
Podemos deduzir do que foi dito acima que a banda Bm ocupada por um sinal de SSTV monocromático é aproximadamente Bm=800+RhxFh, onde Fh é a freqüência de varredura horizontal, Rh é a resolução no sentido horizontal em pontos e 800=2300-1500 é o desvio de freqüência pico a pico do sinal FM de audio.
Desprezamos a banda ocupada pelo pulso de sincronismo, pois esta se encaixa na banda  do sinal de vídeo em torno de 1200 Hz.
Só para comparar, um sinal de TV gasta uma banda de 6 MHz !, mas com 525 linhas e 30 imagens por segundo, o que permite a ilusão de movimento.