Dire
Artikelen: 0
Berichten: 1
Lid geworden op: vr 30 nov 2012, 13:46

Efficient indelen data in groepen

Ik heb een tabel waarin grote hoeveelheden diktes staan. Het gewicht is het gevolg van deze diktes (geen 1op1 verhouding).

Wij mogen altijd hogere diktes toepassen, maar nooit lagere. Nu willen wij deze lijst indelen in groepen, zie het voorbeeld. De lijst is nooit hetzelfde en nooit evenlang. Nog zijn de groepen gelijk in hoeveelheid, maar deze mikken wij meestal op 6 stuks.

Dit doen wij iedere keer handmatig waarbij iemand steeds de afweging maakt hoeveel groepen toe te passen waar deze splitsing te maken.

Nu is mijn vraag, is hier niet een wetenschappelijke benadering voor, zodat wij dit in een formule kunnen verwerken, of een visual basic loopje van te maken.

Met vriendelijk groet,

Daniel
Bijlagen
groepen
groepen 441 keer bekeken
Gebruikersavatar
dannypje
Artikelen: 0
Berichten: 768
Lid geworden op: zo 27 mei 2012, 20:30

Re: Efficient indelen data in groepen

Je kan uiteraard altijd een programmaatje schrijven om deze verdeling te maken, maar als je zegt dat iemand handmatig kijkt en dan beslist hoeveel groepen er gemaakt moeten worden, denk ik dat je zal moeten trachten te modelleren hoe die iemand zijn beslissing neemt.

Je zou lineair kunnen splitsen, afhankelijk van hoeveel groepen je wil. Anderzijds zou je ook rekening kunnen houden met een zekere 'verdeling' van de gewichten (ttz. als er veel afstand is tussen gewichten zou je die kunnen groeperen, en daar waar de gewichten dichter bij mekaar liggen meer groepen gaan toekennen. Dan zou je de distributie van de gewichten moeten opstellen en op basis daarvan beslissen. Zelf niet zeker hoe je dit best zou aanpakken.
In the beginning, there was nothing. Then he said:"Light". There was still nothing but you could see it a whole lot better now.
Gebruikersavatar
Drieske
Artikelen: 0
Berichten: 10.179
Lid geworden op: za 12 jul 2008, 17:07

Re: Efficient indelen data in groepen

Opmerking moderator

Verplaatst naar Programmeren.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.
Gebruikersavatar
Xenion
Artikelen: 0
Berichten: 2.609
Lid geworden op: za 21 jun 2008, 10:41

Re: Efficient indelen data in groepen

Er bestaat een techniek die K-means clustering heet.

Simpel uitgelegd onderstel je dat je in een dataset K verschillende groepen hebt. Elk van die groepen heeft een gemiddelde. Een datapunt hoor tot de groep waarvan het gemiddelde het dichtste bij is.

Het algoritme zal iteratief de K gemiddeldes proberen te bepalen die voor een goeie indeling zorgen.

Terug naar “Informatica en programmeren”