Additionally, paste this code immediately after the opening tag: Tijdschrift digitaliseren - Forum Wereldfietser

Tijdschrift digitaliseren

We hebben een idee om deze fantastische site nog wat te verbeteren (in onze ogen dan) :wink: .

Aangezien wij nog maar vier jaar fietsen en slechts ??n jaar lid zijn van de Wereldfietser, leek het ons leuk om ook de oude Wereldfietser-tijdschriften te kunnen lezen. Nu weten we dat een aantal artikelen ingescand is, maar wij vinden dat het niet zo fijn leest en (nog) niet compleet is.

Ons lijkt het een leuk idee om de artikelen uit alle oude wereldfietsers via OCR (teksherkenning) te digitaliseren zodat ze makkelijk leesbaar op de site kunnen worden geplaatst (alleen toegankelijk voor leden?).Zo kunnen alle nieuwe leden ook alle oude verhalen lezen.

Wij willen deze taak best op ons nemen, alleen moet iemand ons dan wel even alle jaargangen Wereldfietser uitlenen (als iemand/de vereniging die nog heeft). Aangezien we de aankomende twee maanden op de fiets zitten, zouden we er begin september aan kunnen beginnen :D .

Jan Willem en Gudrun
Dat lijkt me een goed plan!

Ik ben nu voor het derde jaar lid,
en ben ook benieuwd naar de oudere nummers
Bovendien ben ik een aantal nummers kwijt...

Het lijkt me een goed plan de sectie alleen voor niet-leden toegankelijk te maken. Dit om freeridersgedrag tegen te gaan. Wellicht is het plaatsen van een nummer op de inlogpagina voor deze sectie prikkelend voor het aantrekken van nieuwe leden.

Ik wacht het wel af, het idee juich ik toe
Veel plezier met fietsen!

Groetjes,
Joost Verboven

Lijkt ons ook wel leuk! Inderdaad alleen toegankelijk voor leden dan, maar toch wel leuk om oude verhalen te lezen!

Neem anders eens contact op met de redactie.

Succes!

Enne... we mailen jullie snel voor jullie vertrek nog even met onze ervaringen en tips van de noordkaap!

El & El

Het is zelfs zo'n goed idee, dat jullie niet de eerste zijn die dit graag willen. Het is zelfs al mogelijk, maar idd via de scans. De jaargangen 1994 tot 1998 zijn grotendeels gedigitaliseerd. Dit zijn scans die als afbeelding te bekijken zijn. Er is gepoogd dit via OCR te doen, maar dit leverde een te slecht resultaat op om te gebruiken en zou teveel tijd hebben gekost om foutloos te maken.

Overigens zijn oude jaargangen voor een groot deel nog na te bestellen. Meer informatie hierover is te vinden op de tijdschriftsite: http://www.holcus.nl/tijdschrift/magframeshol.htm

Nieuwere jaargangen worden nog niet op de website geplaatst, deze zijn hoe dan ook nog leverbaar.

Om verder te gaan op je opmerking, probeer het eens uit of OCR bij jou/jullie wel werkt. Neem een van de Wereldfietser tijdschriften die je wel hebt en scan een paar pagina's in met OCR. Liefst een paar totaal verschillende pagina's. Dus een met foto's en tekst, een met tekst, een met bijvoorbeeld wat nieuws. Mocht het je wel lukken, dan zijn we zeer geïnteresseerd.

En voor degenen die de link nog niet hebben gevonden:

http://www.wereldfietser.nl/mos/index.p ... &Itemid=50

Het staat nog niet op een echt logische plaats. :oops:
(menu -> landeninformatie -> oude jaargangen tijdschrift)

Groeten,

Marco

Hi Marco & Jarno,
Ik heb een aantal van de ingescende pagina's bekeken en uitgeprint, maar ik ben er niet stuk van. Op het scherm is het vrijwel niet te lezen en als je het uitprint, dan is het net te groot voor een A4-tje. Zou dit beter kunnen?
Groet,
Rena :wink:

Hallo Rena,

De kwaliteit kan voorlopig niet beter. :(
Aangezien het vrij veel pagina's zijn, kost het teveel schijfruimte en dataverkeer om ze in hoge kwaliteit op te slaan.

Het printen kan misschien wel beter. Maar is erg omslachtig:
-pagina opslaan op schijf.
-openen in een fotoprogramma, of windows viewer
-afdrukken, passend maken aan pagina.

Ik zou de pagina's kunnen verkleinen aan een A4tje, maar dan wordt de leesbaarheid (op het scherm) nog iets slechter.

Groeten,

Marco

renaw schreef:Hi Marco & Jarno,
Ik heb een aantal van de ingescende pagina's bekeken en uitgeprint, maar ik ben er niet stuk van. Op het scherm is het vrijwel niet te lezen en als je het uitprint, dan is het net te groot voor een A4-tje. Zou dit beter kunnen?
Groet,
Rena :wink:
Ja Rena, dit kan beter. De gebruikte scanmethode was niet de allerbeste. Ik zal eens wat proberen >>>>>
Vergelijk
http://www.wereldfietser.nl/show.php?id=2264
eens met
http://www.leonpoels.nl/fotografie/pagina.gif
Mijn scan is 86 kB versus 62 kB voor de ander.
Met meer bytes kan het allemaal nog stukken beter. Maar dit leek me een aardig compromis tussen bestandsgrootte en leesbaarheid.
Er is overigens geen dure scanner voor nodig, die van mij was 5 jaar gelden 169 gulden. Dus de allergoedkoopste is prima, op voorwaarde dat er een descreenoptie in de software zit, waarmee je het raster van het drukwerk grotendeels verwijdert. Je kunt het ook "handmatig" verwijderen, maar dat is weer extra werk.
Hoe het ook zij, het blijft wel monnikenwerk en iedereen die het graag doet kan het best met open armen ontvangen worden!.
Is wil ook best bijstaan en tips geven bij het maken van de instellingen.
O ja. Ik heb alle oude nummers, dus ze zijn te leen, maar ik wil ze dan wel terug. Kom ze maar halen, de koffie staat klaar.
Leon

Wat een reacties!

Jarno, wij hadden inderdaad ook gezien dat de nummers van '94 tot '98 al op internet staan. We snappen dat de recentere nummers nog te krijgen zijn maar het zou voor leden een geweldige service zijn als ook de recentere nummers online op te vragen zouden zijn.

Morgen zullen wij proberen of onze scanner met OCR beter scant de de resultaten tot nu toe. De artikelen kunnen dan gewoon in HTML-formaat opgeslagen worden waardoor er nog minder schijfruimte zal worden gebruikt dan de 62 kb die vandaag berekend is.

We vroegen ons ook af hoeveel schijfruimte (nog) beschikbaar is voor de website?

Wordt vervolgd!

JW & Gu
Als jullie OCR-software in staat is om daar in een keer goede tekst uit te halen, ben ik benieuwd welke software jullie gebruiken.
Ik ben ooit op zoek geweest naar goede en goedkope OCR, maar die ben ik niet tegengekomen. Het zou leuk zijn als het lukt.

Beste mensen,

Wat geweldig dat brainstormen!!!!!!!!!!
Zo zie je maar weer, waar een forum wel niet allemaal goed voor is.

Ik ben erg benieuwd wat hier uit gaat komen, want des te meer ervaringen, des te meer ideeen, des te meer kennis.

En aangezien de vereniging gedragen wordt door vrijwilligers, zijn mensen met ideeen en helpende handen altijd welkom!

Jongens, ik vind het nu al geweldig hoe een ieder mee denkt!

Groet,
Rena :wink:

Mochten de genoemde opties nu niet werken of te arbeidsintensief zijn, dan zou je natuurlijk ook nog PDF's kunnen maken. Voorwaarde is dan wel dat de digitale bestanden nog ergens op een schijfje bij de vormgever staan. Hij/zij kan ze dan heel eenvoudig omzetten naar PDF-formaat.

Sandra

Artikelen opslaan als afbeelding heeft een groot aantal nadelen. Eerste is het aantal Kb dat nodig is. Aangezien het geheel via internet moet kunnen worden gelezen is dat een nadeel (schijfruimte en vooral dataverkeer).
Verder zijn de teksten niet te doorzoeken, omdat het voor de computer geen tekst is.
De tekst is niet te bewerken. Het is bijvoorbeeld lastig een klein stukje tekst van een artikel uit te printen, i.p.v. de gehele pagina.
De kwaliteit van de prints is laag, of het aantal Kb is hoog. Platte tekst kan iedere printer goed printen, terwijl de bestanden klein zijn.

Artikelen al dan niet met afbeeldingen opslaan inb tekstformaat is dus een veel betere optie, alleen de weg ernaar toe is lastiger.

Zijn de teksten (die toch digitaal zijn aangeleverd bij de drukker) niet meer te vinden?
Anders is OCR een oplossing. Maar OCR software met een 100% goede tekstherkenning bestaat (nog) niet. Bovendien is het arbeidsintensief. Maar met een aantal leden moet het te doen zijn. Ik wil dan ook wel meehelpen.

Hoi,
Ik denk dat de wenselijkheid om het tijdschrift als tekst op internet te zetten bij de uitgever toch wel beperkt is.
De verhalen in de WF zijn anders dan bijvoorbeeld de artikelen in de consumentengids lang houdbaar.
Het zou al heel wat zijn als de scans leesbaar zouden zijn, wat zeer wel mogelijk is zoals ik hierboven heb laten zien. Van pdf-bestanden wordt de gemiddelde internetter overigens niet bepaald blij en het apart maken van tekst en afbeeldingen levert volgens mij niet echt veel winst op qua geheugenruimte, om van de hoeveelheid werk maar te zwijgen.
Maar dit is natuurlijk maar een inschatting van mij :)
Leon

renaw schreef:Op het scherm is het vrijwel niet te lezen en als je het uitprint, dan is het net te groot voor een A4-tje.
De kwaliteit is zoals je uit het topic kunt opmaken niet gelijk te verbeteren. Het formaat op papier zou een printerinstelling moeten zijn.
Gudrun schreef:We vroegen ons ook af hoeveel schijfruimte (nog) beschikbaar is voor de website?
Zie de ruimte maar niet als probleem. Wel de omvang per pagina. Dit moet zo laag mogelijk tegen zo hoog mogelijke kwaliteit.
Leon schreef: Met meer bytes kan het allemaal nog stukken beter. Maar dit leek me een aardig compromis tussen bestandsgrootte en leesbaarheid.
Er is overigens geen dure scanner voor nodig, die van mij was 5 jaar gelden 169 gulden. Dus de allergoedkoopste is prima, op voorwaarde dat er een descreenoptie in de software zit, waarmee je het raster van het drukwerk grotendeels verwijdert. Je kunt het ook "handmatig" verwijderen, maar dat is weer extra werk.
Voordat mensen massaal gaan scannen, wacht daar even mee. Er zijn scans beschikbaar met een hogere kwaliteit. Ik zou de cd weer even moeten opzoeken, maar Harry heeft dat al eens gedaan voor ons. Die scans via een betere (lees: slimmere) methode comprimeren zou al een hele verbetering kunnen betekenen.
Gudrun schreef:We snappen dat de recentere nummers nog te krijgen zijn maar het zou voor leden een geweldige service zijn als ook de recentere nummers online op te vragen zouden zijn.
Hier zouden we over kunnen discussieren, maar neem van mij aan dat dit geen zin heeft. Er is vanuit de vereniging/tijdschrift wel een minimale tijd gesteld tussen uitgave in het tijdschrift en een digitale versie op het web.
baartmns schreef:Voorwaarde is dan wel dat de digitale bestanden nog ergens op een schijfje bij de vormgever staan.
Helaas...
jpost0760 schreef:Zijn de teksten (die toch digitaal zijn aangeleverd bij de drukker) niet meer te vinden?
Voor de nieuwere exemplaren van het tijdschrift zal dit ook minder een probleem zijn. Van de oude is geen digitaal materiaal beschikbaar.

Voor de mensen die een slimmere methode kunnen verzinnen, hier een aantal scans in het origineel door Harry gescande formaat:
http://www.wereldfietser.nl/images/tijd ... ans-groot/

Als iemand hier een goede methode voor heeft, en een batch opdracht kan maken. Dan is het zo gepiept.

Succes,

Marco

PS het enige wat ik aan deze scans gedaan heb, is ze aangepast aan een breedte van 800 pixels. Dan past het in ieder geval op het beeldscherm.

Marco de Wit schreef:Voor de mensen die een slimmere methode kunnen verzinnen, hier een aantal scans in het origineel door Harry gescande formaat:
http://www.wereldfietser.nl/images/tijd ... ans-groot/
Als iemand hier een goede methode voor heeft, en een batch opdracht kan maken. Dan is het zo gepiept.
PS het enige wat ik aan deze scans gedaan heb, is ze aangepast aan een breedte van 800 pixels. Dan past het in ieder geval op het beeldscherm.
Marco,
Welk progrtamma gebruik je?
Leon

Adobe Photoshop 7

Hoi,
Ik heb CS, dus jij mist waarschijnlijk de optie safe for web. Dus het is misschien wat algemeen:
800 breed kan inderdaad net leesbaar zijn. De meeste beeldschermen zijn tegenwoordig echter 1024 of meer trouwens, dus 1000 als breedte kiezen kan ook.
* zet image > mode > indexed color op RGB color
* filter > blur > gaussian blur > 0,5 pixels
* image > image size > width = 800 met resample image aan
* file > save as > naam geven + compuserveGIF kiezen
opties daarna:
* Palette: perceptual
* colors = 4
* forced: none
* transparency: uit
* dither: none
* row order: normal
En dan moet de pagina op de schijf staan.
Het grootste verschil zit hem waarschijnlijk in het opslaan als GIF met 4 kleuren. Als de 2 kleuren probeert wordt het niet best en 8 kleuren voegen niet zo gek veel aan de leesbaarheid toe.
Hoe je daar precies een batch van maakt zou ik graag weten, want een batch maken is me nog steeds niet gelukt :?

Succes en laat je pc zwoegen :D
Leon

Zoals beloofd hebben we vandaag even geprobeerd een scan te maken van een pagina uit de nieuwste Wereldfietser.

Je kunt de scan (tijdelijk natuurlijK) bekijken op http://people.zeelandnet.nl/kelck/werel ... /test.html

De tekst is 4kb groot, de foto's zijn nog wat groter (we konden zo snel geen goed "omzetprogramma" vinden) maar dat kan als het goed is nog veranderd worden.

Ons lijkt het artikel zo wel goed leesbaar, de paar kleine foutjes die de OCR nog heeft gemaakt kunnen er snel uitgehaald worden.

Het kost wel wat tijd op deze manier, maar als jullie het wat vinden, willen wij er in september aan beginnen! Wij vinden het leuk om te doen!

JW & Gu