Research and Development 1/^Archief/2009-2010/10/Pilot

Research and Development 1

Patrick van Bommel
Sjaak Smetsers

2010-11
- aankondigingen
- achtergrondinformatie
- colleges
- Cursusinformatie
  - inschrijving
    - - 11
      - 12
- presentaties
- project
  - 4PP-TP
    - Eindverslag
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
    - notes
    - pid
    - pilot
    - Project
    - tussenpresentatie
  - Alpha Apps
    - Eindverslag en Eindproducten
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
    - pid
    - presentaties
    - software design document
    - specificatie
  - AngryPigs
    - Broncode
      - ontwerp
      - specificatie
    - eindrapport
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
    - pid
    - planning
    - presentatie
  - AppArt
    - Development
    - Documenten Fase 1
    - Eindverslag
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
      - 19
    - Presentaties
    - Project Initiation Document
  - AppCetera
    - Documentatie fase 1
    - Eindpresentatie
    - Eindverslag
    - GUI
    - Handleiding
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
      - 19
    - Onderzoek
    - Presentatie pilot
    - Project Initiation Document
    - REST API
    - Tussenpresentatie
  - AppDroid
    - Einddocumentatie
    - Eindpresentatie
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
    - Pilotverslag
    - Planning
    - Presentatie Pilot
    - Requirements
    - Software Design Document
    - Tussenpresentatie
  - AppResski
    - Documenten fase 1
    - Eindverslag
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
      - 19
    - PresentatieFase1
    - Presentatie Pilot
    - Productbeschrijving
    - Project Initiation Document
  - App y u no work
    - bestanden fase 1
    - einddocumentatie
      - 02
      - 03
      - 01
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
    - PID
    - Presentatie Pilot
    - Tussenpresentatie
      - Coon
  - DaStrawberries
    - Beveiliging puntenlijst
    - Broncode Applicatie
    - Eindverslag
    - gebruikersonderzoek resultaten
    - GUI ontwerp
    - Handleiding Applicatie
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05(vakantie)
      - 06
      - 07
      - 08
      - 09(vakantie)
      - 10(vakantie)
      - 11
      - 12
      - 13
      - 14(lustrumweek)
      - 15
      - 16
      - 17
      - 18
      - 19
      - 20
    - onderzoek vragenlijst
    - pid
    - presentaties
    - software design document
    - use cases
  - Harvey
    - Eindpresentatie
    - Eindverslag
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
    - Ontwerpdocument
    - Pilot
    - Projectpagina
    - Tussenpresentatie
  - iPwn
    - documenten-fase-1
    - eindpresentatie
    - Eindverslag
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
    - planning
    - tussenpresentatie
  - JuMP
    - eindpresentatie
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
      - 19
    - Ontwerpdocument
    - PID
    - pilot presentatie
    - tussenpresentatie
    - Verslag
  - LordsOfTheApps
    - eindpresentatie
    - memo's
      - 01
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
    - planning
    - Presentatie Pilot
    - Productdocumentatie (eindverslag)
    - Project Initiation Document
    - Tussenpresentatie
    - Use Cases
  - Minerva
    - eindproduct
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 08
      - 10
      - 12
      - 13
      - 14
      - 15
      - 16
      - 17
      - 18
      - 19
    - onwerpdocument
    - pid
    - tussenpresentatie
  - nAPP
    - Eindverslag
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
      - 12
      - 13
      - 14
    - PID
    - Pilot
    - Presentatie
    - Tussenpresentatie
  - PresentatiePilot
    - - 10
  - sjerik
    - memos
      - 01
      - 02
  - Unknown
    - Eindverslag en source code
    - Fase 1
      - Presentatie
    - memos
      - 01
      - 02
      - 03
      - 04
      - 05
      - 06
      - 07
      - 08
      - 09
      - 10
      - 11
    - Pilot
      - PID
      - Presentatie
- richtlijnen
- weekoverzicht
- werkbesprekingen
2011-12
- colleges
  - Aftrap
  - Latex
  - Ontwerp
  - Presenteren
  - Usability
- deelnemers
- instructies
- planning
- projecten
  - ';drop table projecten--
    - blog
      - week 3
      - week 4
      - week 5
      - week 6
      - week 7
      - week 8
    - eindverslag
    - Presentatie1
    - Presentatie2
  - App6
    - deelproject
  - Appic
  - Appsinth
  - CrApp
  - De OOG
  - Global Coffin Enterprise
  - ItIsATrApp
    - Eindpresentatie
    - eindverslag
    - ExpertReview
    - Logboek
      - Week16
      - Week17
      - Week19
      - Week20
      - Week21
      - Week22
      - Week23
      - Week25
    - Ontwerpdocument
    - Ontwerpdocument LaTeX
    - Presentatie 1
    - Usability
    - Workshop 12juni fotos
  - Kopi Luwak
  - NotYourDroids
  - Oreogroepje
  - Paranoid Android
  - Pineapple
  - TeamRocket
  - Team Amazing
    - Blog
      - [[Research and Development 1/2011-12/projecten/Team Amazing/Blog/|]]
      - week 19
      - week 20
    - Expert Review
    - Ontwerpdocument
  - Unknown
2012-13
- algemeen
  - beoordeling
- colleges
  - Aftrap
  - App-ontwikkeling
  - LaTeX
  - Ontwerp
  - Presenteren
  - Usability
- deelnemers
- instructies
- planning
- producten
- projecten
  - AppelsApp
  - Applaus
  - Dabawi Development
  - dev5
  - heldenapp
  - ITapp
    - about
      - [[Research and Development 1/2012-13/projecten/ITapp/about/|]]
    - beoordeling
    - eindpresentatie
    - eindverslag
    - Expert review
    - Logboek
    - Ontwerpdocument
      - [[Research and Development 1/2012-13/projecten/ITapp/over ons/|]]
    - presentatie1
    - tussenpresentatie
    - Usability Veslag
  - JJM
  - self development app
  - snafu
  - Stuiterballen
  - TOP
  - XXXX
  - XXXXX
2013-14
2014-15
- algemeen
  - beoordeling
- colleges
- deelnemers
- instructies
- planning
- projecten
  - 404 Not Found
  - AppArt
  - appoholics
  - Appsurd
  - AppTastic
  - Dungeon Crawler
  - free(lunch);
  - haystack alien
  - Insert name here
  - Mèh me läppke
  - PCMasterRace
    - App Fase 1
    - App Fase 2
    - Beoordeling
    - Contactpersoon
    - Eindverslag
    - Expert Review
      - [[Research and Development 1/2014-15/projecten/PCMasterRace/Expert Review/|]]
    - Team
    - Usability Review
  - ProjectPalèstra
  - Speelproject
  - Superb Wonderful Amazing Group
    - App Fase 1
    - App Fase 2
    - Beoordeling
    - Contactpersoon
    - eindformulier
    - EINDVERSLAG HERKANSING
    - Expert Review
      - [[Research and Development 1/2014-15/projecten/Superb Wonderful Amazing Group/Expert Review/|]]
    - Usability Review
  - TeamBigMoney
  - Team One
  - TheCakeIsALie
    - App Fase 1
    - App Fase 2
    - Beoordeling
    - Contactpersoon
    - Eindverslag
    - Expert Review
      - [[Research and Development 1/2014-15/projecten/TheCakeIsALie/Expert Review/|]]
    - Team
    - Usability Review
  - Thunder Ducks
  - voorwielaandrijving
2015-16
- algemeen
  - beoordeling
- colleges
  - Aftrap
  - Android1
  - Android3
- instructies
- planning
- projecten
  - ()xxxxxx(ːːːːːːːːːːːːːːːːːːːːː»
    - Eindverslag
    - Expert Review
    - Usability Review
  - Appsent
    - deelpagina
  - AssertTrue
    - Eindverslag
    - Expert Review
    - Usability Research
  - ATM
    - Eindverslag
    - Expert Review
    - Usability Research
  - CampGemini
    - Eindverslag
    - Expert Review
    - Usability Review
  - CBD
    - App Fase 1
    - App Fase 2
    - Eindverslag
    - Expert Review
    - Usability
  - Cervisia Technologies Inc
    - Eindverslag
      - [[Research and Development 1/2015-16/projecten/Cervisia Technologies Inc/Expert Review/|]]
    - Usability Research DikkeBMW
  - DikkeBMW
    - Eindverslag
      - [[Research and Development 1/2015-16/projecten/DikkeBMW/Expert Review/|]]
    - Squad
    - Usability verslag
  - facultime
    - Eindverslag
    - Expert Review
      - [[Research and Development 1/2015-16/projecten/facultime/Expert Review/|]]
    - Usability Research
  - Fristiboyzz
    - App Fase 1
    - Eindverslag
      - [[Research and Development 1/2015-16/projecten/Fristiboyzz/Expert Review/|]]
    - Team
    - Usability verslag
  - MALT
    - App Fase 1
    - App Fase 2
    - eindverslag
    - Expert Review
    - UsabilityResearch
  - New Button
    - App Fase 1
    - App Fase 2
    - Expert Review
    - Usability Review
  - Niet te lang en niet te gek
    - Eindverslag
    - Expert Review
    - Ideeën
    - Ons Team
    - Usability Research
  - puC
    - Eindverslag
    - Expert Review
    - Usability Research
  - Randint
    - App Fase 1
    - App Fase 2
    - Eindverslag
    - Expert Review
    - Usability Research
  - rsi-arm
    - Eindverslag
    - Expert-Review
    - Usability-Research
  - SaltInc.
    - App Fase 1
    - App Fase 2
    - Usability-Research
    - Eindverslag
    - Expert Review
  - Teamo
    - App Fase 1
    - App Fase 2
    - Eindverslag
    - Expert Review
    - Usability Research
  - TheMurmaiders
    - App Fase 1
    - App Fase 2
    - Eindverslag
    - Expert Review
    - Usability Verslag
  - TheOrangeCobras
    - Eindverslag
    - Expert Review
    - Usability Research
  - Wis^4
    - Eindverslag
    - Expert Review
    - Usability Research
agenda
^Archief
- 2007-2008
  - GSM security
  - Malware
  - projecten
    - Automatisering OV betalingsverkeer
    - Beveiliging Netwerkprinters
      - Globale planning
      - Logboek
      - Onderzoek
      - Onderzoeksplan
      - Onderzoeksplan2
        [[Research and Development 1/^Archief/2007-2008/projecten/Beveiliging Netwerkprinters/Referee/|]]
      - Voortgang
      - Waar moeten netwerkprinters tegen beveiligd worden?
    - Beveiliging USB-sticks
      - Globale planning
      - Onderzoeksplan
    - Beveiliging van websites
    - Botnet
    - Contextvrije talen
      - Globale planning
    - DigiD
    - Draadloos-netwerkbeveiliging
      - Globale planning
      - Kladblok
        Certificaten
        
        Onbeveiligd netwerk
  - RFID chip
  - rfid implementatie supermarkt
    - casussen
      - casus1
      - casus2
      - casus3
      - casus4
      - casussjabloon
      - huidige situatie
    - logboek
    - onderzoeksplan
  - rfid supermarkt
  - Veiligheid EPD
  - wolf in schaapskleren
- 2008-2009
  - AI in FPS games
  - AI video games
    - Logboek
    - Onderzoeksplan
    - Pilot
    - Product
    - Referee
  - Botherkenning
  - Building Recognition
    - Logboek
    - Pilot
      - Onderzoeksplan
      - Onderzoeksresultaat
  - C A P T C H A
    - logboek
  - Efficient Leren
    - logboek
  - Genetic algorithms
    - [[Research and Development 1/^Archief/2008-2009/Genetic algorithms/|]]
    - Brainstorm
    - Fase 1
    - Fase 2
    - Logboek
    - Pilot
    - refereeher
  - Gezichts detectie
    - - Installatie
    - Logboek
    - Onderzoek
      - NNBFD
        HistogramEqualizer.java
        
        Matrix.java
        
        Preprocessor.java
        
        [[Research and Development 1/^Archief/2008-2009/Gezichts detectie/Onderzoek/referee/|]]
    - Pilot
  - Handschriftherkenning
    - Logboek
  - Internet en sociale netwerken
    - [[Research and Development 1/^Archief/2008-2009/Internet en sociale netwerken/|]]
    - Logboek
    - LogboekPilot
    - Onderzoek
    - Pilot
  - Kari
    - Conclusie
    - Logboek
    - Onderzoeksplan
    - Presentatie Verslag
    - Resultaten
      - chatlogMarijnKari2
      - onderwerp1
        [[Research and Development 1/^Archief/2008-2009/Kari/Resultaten/onderwerp1/|]]
        
        verkenning
        
        zinnen
        
        [[Research and Development 1/^Archief/2008-2009/Kari/Resultaten/onderwerp2/|]]
        
        zinnen
        
        [[Research and Development 1/^Archief/2008-2009/Kari/Resultaten/onderwerp3/|]]
        
        zinnen
      - Onderzoeksverslag
  - Kunst Generatie
  - Muziek generatie
  - Neural Netwerk
    - gboek
  - Robotstofzuiger
  - Solver
  - Spraaktechnologie
    - Fase1
    - Fase2
    - Logboek
    - Pilot
      - Enquetes
- 2009-2010
- beoordeling
- cursusoverzicht
- excursie
  - Groep1
  - Groep7
  - Groep8

Property "Auteur1" (as page type) with input value " Research and Development 1/^Archief/2009-2010/10Gebruiker:Sanne Derckx" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.
Property "Auteur2" (as page type) with input value " Research and Development 1/^Archief/2009-2010/10Gebruiker:Stan Philipsen" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.
Property "Auteur3" (as page type) with input value " Research and Development 1/^Archief/2009-2010/10Gebruiker:Ko Stoffelen" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.
Property "Auteur4" (as page type) with input value " Research and Development 1/^Archief/2009-2010/10" contains invalid characters or is incomplete and therefore can cause unexpected results during a query or annotation process.

informatie die hoort bij de pilot.

Onderzoeksvragen:

-(Hoe) is het mogelijk verschillende profielen geautomatiseerd te koppelen? (vb; aan de hand van een hyves-profiel automatisch het bijbehorende facebook-profiel te herkennen.

Hoe ik het me voorstel:

laat maar horen wat jullie er van vinden. Op de achtergrond moeten we dus eerst het hyvesprofiel geautomatiseerd bekijken. Vervolgens zoeken we bijvoorbeeld op facebook naar vergelijkbare namen. Vervolgens vergelijken we de interesses en vrienden die in beide netwerken voorkomen (jantje heeft bijvoorbeeld op zowel Hyves als Facebook een vriend met de naam Pietje). Uiteindelijk kunnen we nog proberen via een zoekmachine te zoeken op de naam en de resultaten te bekijken. Wanneer een van de resultaten die de zoekmachine ons geeft over een onderwerp gaat wat de persoon volgens zijn hyvesprofiel interessant vindt zou het waarschijnlijk kunnen zijn dat deze website ook daadwerkelijk over onze Jantje gaat.

Voorbeeld

Gebruiker wilt weten wat er over hem te vinden is op het internet. Hij gaat naar WieOWie.nl. Daar tikt hij zijn naam in. Vervolgens krijgt hij een lijstje met zoekresultaten: Hyvesprofielen, resultaten via google etc. Maar de resultaten via een zoekmachine als google worden vervuild door naamgenoten. Daarom zou het handig zijn als we kunnen bepalen welke sites echt gaan over de persoon die wij zoeken. Aan de hand van een hyvesprofiel kunnen we bepaalde interesses zien. Is het mogelijk dat we deze gegevens combineren om zo betere zoekresultaten te krijgen? Gebruiker voert (hyvesprofiel-)naam in en krijgt (betere?) zoekresultaten. Is die reactie op de pagina van de breiclub van de persoon waar we naar zoeken?

Onderzoeksvragen

Hoe kunnen we informatie die op websites staat eenvoudig geautomatiseerd opslaan? In hoeverre is het mogelijk zoekresultaten te personaliseren met behulp van openbare gegevens?

Aanpak

We willen ten eerste een aantal tools gaan testen om gegevens van sites kunnen crawlen. Het resultaat van deze stap is een lijstje met de voor- en nadelen van verschillende tools. Hiervoor zullen we de tools ook moeten testen. Vervolgens proberen we deze gegevens geautomatiseerd op te slaan. Het resultaat hiervan is een prototype dat de gegevens ophaalt en op een eenvoudige manier verwerkt. Ook willen we in de pilot kijken welke gegevens we mogelijk geautomatiseerd zouden kunnen vinden. Dit doen we door te onderzoeken welke gegevens er op het internet (openbaar) toegankelijk zijn. Zo kijken we welke gegevens je als hyvesbezoeker, hyvesgebruiker of hyvesvriend over mensen kunt zien. In hoeverre zijn deze gegevens aan te passen door de gebruiker en wat zijn de instellingen die het meeste voorkomen? Welke gegevens op Facebook zijn toegankelijk? Zijn er nog meer profielen die we zouden kunnen koppelen? Verder lijkt het handig tijdens de pilot te testen in hoeverre het automatisch zou kunnen werken. Dit kunnen we doen door zelf computer te 'spelen'. We simuleren onze software. We proberen bij enkele verschillende personen welke data we kunnen vinden. Voorbeeld: Profiel van Jan Janssen, interesses (volgens Hyves): voetbal, uitgaan. Leeftijd: 18. Hoe zou een computer (onze software) deze persoon kunnen herkennen?

Crawling vs Scraping

Onze bots bestaan in feite uit 2 gedeelten: een crawlgedeelte en een scrapegedeelte. Met crawlen bedoelen we het systematisch ophalen van webpagina's. Ter illustratie: men geeft een beginpagina op en deze wordt (als string HTML) opgehaald. Vervolgens worden alle hyperlinks van de pagina afgehaald. (Meestal alle waarden van "href" attributen.) Deze worden aan een soort van lijst (queue) toegevoegd en één voor één opgehaald, waarna dit proces zich recursief herhaald. De gebruiker kan meestal zelf een stopcriterium opgeven. Met scrapen bedoelen we het extraheren van bruikbare informatie uit deze HTML string. Bijvoorbeeld woonplaats, geboortedatum, etc. Dit gebeurt voornamelijk door StringFind-achtige functies of pattern matching met reguliere expressies. Hoe dit precies gebeurt is sterk afhankelijk van de programmeertaal. Wel is het vaak gebaseerd op het feit dat bepaalde informatie op een vaste plek op een pagina staat, met bijvoorbeeld vaste HTML-tags er omheen waar naar gezocht kan worden.

Links

crawler4j: Een open-source webcrawler, geschreven in Java.
Scrapy: Een open-source webcrawler, geschreven in Python.
[1]: Een artikel waarin beschreven staat hoe Wget en grep gebruikt kunnen worden als webscraper.
[2]: Informatie over webcrawlers.
[3]: Informatie over webscraping.

Research and Development 1/^Archief/2009-2010/10/Pilot

Inhoud

Voorbeeld

Onderzoeksvragen

Aanpak

Crawling vs Scraping

Links

Navigatiemenu

Persoonlijke instellingen

Naamruimten

Varianten

Weergaven

Meer

zoek

Afdrukken/exporteren

Hulpmiddelen