Megapodpowiedź:
1. Załóż, że suma MD5/SHA pliku to jego zawartość.
2. Pliki o tym samym MD5/SHA prawie na pewno będą miały tą samą długość (jak nie, to czym prędzej leć zagrać w totka)
3. masz duet sort/uniq do szukania powtórzeń.
4. Program md5deep wyświetla wszystko, co jest potrzebne do rozwiązania (długość, suma, ścieżka)
$> md5deep -zr /bin
119408 1f1e1c100c56aa8ef9e4fefdf879f67f /bin/csplit
28320 2ec042ff67e77d4dc53615c8e519b848 /bin/gnomevfs-mkdir
39576 a92c734a9d6661050e6a5f6acda452da /bin/ngettext
5859 71c53f5c0c0529f82b5a4a01a77feddc /bin/mailstat
11720 737a6f1e3845227dfdadb42004cc9096 /bin/python2.7
19440 407ac8e662e61bd01fd69409a6eb6a79 /bin/abrt-dump-oops
44856 9d256b9a7ad13ca6bb7637917d78c106 /bin/card_eventmgr
15560 15dbfc42f1163d85ad94200a81435ba5 /bin/arjdisp
...
...
Zgrabnym potokiem uzyskujesz wynik:
$> md5deep cośtamcośtam | sort cośtamcośtam | uniq cośtamcośtam
860728 3502c8fea671183301fe641b3d4397c0 /sbin/sendmail.sendmail
860728 3502c8fea671183301fe641b3d4397c0 /sbin/sendmail
430728 7990fbe0bf7c7a325e44dbb68c7e7759 /sbin/btrfsck
430728 7990fbe0bf7c7a325e44dbb68c7e7759 /sbin/btrfs
403056 f2b81d5280e5e7bcdc5d3add1aa8e85d /sbin/fsck.hfsplus
403056 f2b81d5280e5e7bcdc5d3add1aa8e85d /sbin/fsck.hfs
...
...
Cośtamcośtam doczytaj sobie w instrukcjach do poleceń.