open(READER,"index.html");
@contents = <READER>;
close READER;
$contents = join '', @contents;
while ($contents =~ /\>([^<>]+)\</g)
{
print "$1\n";
}
Kiindulásnak használd a fentit. A kód tényleg csak a ><-ök közti szövegeket nézi így, de ne felejtsd el, h a html tagok egymásba ágyazhatók (ezért lesznek ennek az outputjában üres sorok, pl. </div></div> miatt).