Data veredelen - bewerkingenData veredelen verloopt altijd volgens een vast stappenplan:1. Data analyseVoordat de geautomatiseerde veredeling kan beginnen, analyseert BaseControl de aangeleverde data-bestanden. Om te zien of deze geautomatiseerd kunnen worden veredeld, hoe de software moet worden afgesteld, en om een inschatting te maken van benodigde tijd en kosten. Op deze data-analyse baseren wij onze offerte. 2. Inlezen of importerenDe data moeten worden 'ingeladen' in de verdelings-software. Dat kan in veel gevallen door de data te importeren. De bronbestanden moeten zich daartoe wel lenen. Een bestand met komma- of tab-gescheiden velden is daar een goed voorbeeld van. Ook kan uit EXCEL worden geïmporteerd. 3. Splitsen / scheidenAlle gegevens worden zoveel mogelijk gesplitst en van elkaar gescheiden in aparte velden. Zij worden daartoe eerst grondig geanalyseerd in hun context en onderlinge relaties. Zo wordt bijvoorbeeld 'dhr. prof. mr. J.G. (Johan) van Dam MBA' verdeeld over zeven velden: geslacht (= man), titels voor (= prof. mr.), voorletters (= J.G.), tussenvoegsel (= van), achternaam (= Dam), titels na (= MBA) en roepnaam (= Johan). Een dergelijke splitsing vindt ook plaats bij alle adres- en telecommunicatie-gegevens. 4. OpschonenAlle gegevens worden gescreend op kennelijke schrijffouten (bijvoorbeeld dubbele spaties, punten en komma's op onlogische plekken, harde returns, tabs en andere leestekens) en daarop gecorrigeerd. Gegevens van Nederlandse adressen worden gevalideerd aan de hand van de Postcodetabel. Waar nodig worden adressen, huisnummers, postcodes en woonplaatsen verbeterd. Indien een adres niet met de Postcodetabel kan worden gematched, wordt dat apart in het retourbestand vermeld. 5. Uniformeren / standaardiserenAlle gegevens worden volgens een aantal algemeen geldende afspraken uniform (eenduidig) gemaakt. Een aantal velden begint bijvoorbeeld altijd met een hoofdletter (achternaam, roepnaam, straatnaam, plaatsnaam, etc), een aantal juist nooit (geslacht, titels, voorvoegsels etc). Titels worden volgens een eenduidige schrijfwijze in de juiste volgorde gezet en tussen voorletters komt een punt. Telecommunicatiegegevens worden volgens eenduidige notatie vermeld, rekening houdend met het aantal cijfers van het kengetal. 6. AanvullenAlle gegevens worden waar nodig aangevuld. Zo wordt het geslacht, als dat niet expliciet wordt vermeld, indien mogelijk vastgesteld aan de hand van de roepnaam. Aan de hand van de Postcodetabel worden ontbrekende data in de (Nederlandse) adresgegevens aangevuld. 7. OntdubbelenDesgewenst kunnen mogelijk dubbele relaties als zodanig worden aangemerkt. 8. Handmatige checkBaseControl realiseert zich dat data-verdeling een complexe materie is. Altijd zullen er twijfelgevallen blijven bestaan en soms kan de keuze niet aan een computer worden overgelaten. Het betreft immers uw kostbare relatiegegevens. Als 'final touch' vindt er dan ook altijd tot slot een handmatige controle plaats. Daarbij worden wij geholpen door de analyse-software, want die detecteert precies op welke punten een menselijke keuze nodig is. Die maken wij dan en bij twijfel: raadplegen wij u! Bij het veredelen worden de relatiegegevens uitgesplitst naar de volgende 31 velden:
|
BaseControl | FileMaker Pro specialist | Westeinde 53 2275 AC Voorburg (Zuid Holland)
(Binnen 30 km vanaf Leiden, Zoeterwoude, Alphen aan den Rijn, Gouda, Zoetermeer, Rotterdam, Schiedam, Vlaardingen, Den Haag, 's-Gravenhage, Haaglanden, Wassenaar, Voorschoten, Leidschendam, Westland, Wateringen, Delft, Pijnacker, Rijswijk, Nootdorp; maar wij opereren in heel Nederland)



